[使用したデータ]
作品名が同じで出版社が異なるものを選んだ。理由は、出版社特有の編集の仕方があるかどうか興味をもったからである。
・ 「列車」−太宰治 新潮社
・ 「列車」−太宰治 筑摩書房
[分析1と結果]
それぞれ1文を1サンプルとし、50サンプルずつ以下の10項目の使用頻度を観測した。(品詞の分類については形態素解析「茶筅」を用いた。)
(変数)
・ 名詞、動詞、副詞、形容詞、助詞、助動詞、記号、連体詞、感動詞、読点
10個の変数のうち、どの変数が2つの作品の特徴をよく説明しているか調べるために、ステップワイズ法により変数選択を行った。選択基準にはマハラノビスの距離を用いた。なお、計算にはSPSSを使用した。結果を、表1から表5に結果を示す。
表1:ステップワイズ法による変数選択
ステップ
投入済み
最低D2乗
統計量
正確な F 値
統計量 自由度1 自由度2 有意確率
1 記号 0.155766 3.894146 1 98 0.051271
2 読点 0.5677 7.023837 2 97 0.001417
3 形容詞 0.732405 5.978819 3 96 0.000884
表2:固有値
関数 固有値 分散の % 累積 % 正準相関
1 .187(a) 100.0 100.0 .397
a 最初の 1 個の正準判別関数が分析に使用されました。
表3:Wilks のラムダ
関数の検定 Wilks のラムダ カイ2乗 自由度 有意確率
1 .843 16.530 3 .001
表4:分散共分散行列の差のBOX検定
Box の M 検定 49.846
F値 近似 8.032
自由度1 6
自由度2 69583.698
有意確率 .000
グループ共分散行列が等しいという帰無仮説を検定します。
判別分析-レポート
[使用したデータ]
作品名が同じで出版社が異なるものを選んだ。理由は、出版社特有の編集の仕方があるかどうか興味をもったからである。
「列車」-太宰治 新潮社
「列車」-太宰治 筑摩書房
[分析1と結果]
それぞれ1文を1サンプルとし、50サンプルずつ以下の10項目の使用頻度を観測した。(品詞の分類については形態素解析「茶筅」を用いた。)
(変数)
名詞、動詞、副詞、形容詞、助詞、助動詞、記号、連体詞、感動詞、読点
10個の変数のうち、どの変数が2つの作品の特徴をよく説明しているか調べるために、ステップワイズ法により変数選択を行った。選択基準にはマハラノビスの距離を用いた。なお、計算にはSPSSを使用した。結果を、表1から表5に結果を示す。
表1:ステップワイズ法による変数選択
ステップ
投入済み
最低D2乗 統計量
表2:固有値
表3:Wilks のラムダ
関数の検定 Wilks のラムダ カイ2乗 自由度 有意確率 1 .843 16.530 3 .001
表4:分散共分散行列の差のBOX検定
表5:分...