KS法クラスター分析と潜在混合分布モデル

 東京都立大学名誉教授の倉沢進先生は,クラスター分析のひとつの手法であるKS法クラスター分析を1986年に公表しました。社会地区分析の手法として,古くは因子分析が使われていましたが,因子分析には負荷量の小さな因子を過少評価してしまうという問題点があったため,クラスター分析が使われるようになっていました。

 

 当時のクラスター分析の主流は,階層的クラスター分析でした。しかしながら,階層的クラスター分析はデンドログラムなどを参考にして,析出するクラスター数を決めるのですが,その決定方法が恣意的であるという批判を避けることができませんでした。それに対して倉沢先生は,非階層的クラスター分析の手法を開発したのです。分析対象全体を考慮した場合,クラスター内の類似度が最も高く,クラスター間の類似度が最も低くなるクラスターを最適解とする,というのがKS法クラスター分析の立場でした。

 

 倉沢先生が開発したKS法クラスター分析は,批判もされませんでしたが,採用もされない状態にありました。そこで浅川が2008年に,「社会地区分析再考―KS法クラスター分析による二大都市圏の構造比較―」という論文を社会学評論に投稿し,その成果を改めて世に問いました。プログラムも公開し,誰もが使えるようにしたのですが,結果は倉沢先生のときと同様,誰からも批判もされませんでしたが,採用もされませんでした。

 

 本日,M-plusを最新バージョンのver8にアップし,それとともに『M-plusとRによる構造方程式モデリング入門』を再度読み直していたところ,「潜在混合分布モデル」を再発見しました(これまでも読んでいたはずですが,全く頭に入っていませんでした)。この「潜在混合分布モデル」は非階層的クラスター分析の手法のひとつだったのです。しかもクラスター数の決定方法は,「ブートストラップ法による尤度比の差の検定に基づく方法(Bootstrap loglikelihood test: BLRT)では,あるクラス数の場合(t)とクラス数を1つ減らした場合(t-1)の適合度の差が有意に異ならなくなるまでクラス数を増やし,有意な改善が見られなくなった時点で,クラスがtー1個であると仮定したモデルを採用」するというものでした(小杉孝司・清水裕士 2014: 233)。原理的にはKS法クラスター分析と,同じ立場にたつものでした。

 

 倉沢先生は30年も前に,このことを指摘しておられました。KS法クラスター分析の先見性に敬意を払いつつも,今後は横断的分析の場合*は潜在混合分布モデルを用いて社会地区分析を行い,統計学者と同一の俎上で議論したいと思います。

 

*なお,縦断的分析の場合は,別の方法を考える必要があります。詳しくは拙著(Tatsuto ASAKAWA, Changes in the Socio-Spatial Structure in the Tokyo Metropolitan Area: Social Area Analysis of Changes from 1990 to 2010, Development and Society, Vol. 45, No. 3, 2016, pp.537-562)をご覧ください。