cosineSimilarity
コサイン類似度を使用した文書の類似度
構文
説明
は、単語カウントから派生させた tf-idf 行列を使用して、指定された文書のペア単位のコサイン類似度を返します。similarities = cosineSimilarity(documents)similarities(i,j) のスコアは、documents(i) と documents(j) の間の類似度を表します。
は、similarities = cosineSimilarity(documents,queries)documents 内の単語カウントから派生させた tf-idf 行列を使用して、documents と queries の間の類似度を返します。similarities(i,j) のスコアは、documents(i) と queries(j) の間の類似度を表します。
は、similarities = cosineSimilarity(bag)bag 内の単語カウントから派生させた tf-idf 行列を使用して、指定された bag-of-words または bag-of-n-grams モデルによって符号化された文書のペア単位の類似度を返します。similarities(i,j) のスコアは、bag によって符号化された i 番目の文書と j 番目の文書の間の類似度を表します。
は、similarities = cosineSimilarity(bag,queries)bag 内の単語カウントから派生させた tf-idf 行列を使用して、bag-of-words または bag-of-n-grams モデル bag によって符号化された文書と queries の間の類似度を返します。similarities(i,j) のスコアは、bag によって符号化された i 番目の文書と queries(j) の間の類似度を表します。
は、行列 similarities = cosineSimilarity(M)M の行ベクトル内の符号化されたデータの類似度を返します。similarities(i,j) のスコアは、M(i,:) と M(j,:) の間の類似度を表します。
は、行列 similarities = cosineSimilarity(M1,M2)M1 と行列 M2 内の符号化された文書間の類似度を返します。similarities(i,j) のスコアは、M1(i,:) と M2(j,:) の間の類似度に対応します。



