Jaccard係数

Page content

Jaccard係数は2つの集合に含まれている要素のうち共通要素が占める割合を表しています。 Jaccard係数が大きいほど2つの集合の類似度は高い

$$ J(A, B) = \frac{|A \bigcap B|}{|A \bigcup B|} $$

Rで計算してみます

> library('clusteval')
> vec1 = c(1,1,1,0,0,0,0,0,0,0,0,0)
> vec2 = c(0,0,1,1,1,1,1,0,1,0,0,0)
> cluster_similarity(vec1, vec2, similarity = "jaccard")
[1] 0.3269231
About Wang Zhijun
機械学習好きなプログラマー