Similarity 五种常见的相似度算法:余弦相似度(cosine_similarity)、jaccard相似度、编辑距离(Levenshtein)、MinHash、SimHash + 海明距离。 博客详情:http://www.downdawn.com/blog/detail/22/