Jaccard係数
Page content
Jaccard係数は2つの集合に含まれている要素のうち共通要素が占める割合を表しています。 Jaccard係数が大きいほど2つの集合の類似度は高い
$$ J(A, B) = \frac{|A \bigcap B|}{|A \bigcup B|} $$
Rで計算してみます
> library('clusteval')
> vec1 = c(1,1,1,0,0,0,0,0,0,0,0,0)
> vec2 = c(0,0,1,1,1,1,1,0,1,0,0,0)
> cluster_similarity(vec1, vec2, similarity = "jaccard")
[1] 0.3269231