
『Word Frequency Distributions』(Baayen )の日本語抄訳および解説書的なものとして非常に重宝する。Baayenの説明は丁寧だが諄すぎる部分もあって内容理解が困難な箇所も多いが、こちらでは記号法などは共通な上で適度に簡略化されているため概略が理解しやすくなっている。しかし逆にBaayenを参照しないと数式で使用されている記号の意味などがわからない場合もあるので両方合わせて読むべきであろう。
影浦峡(2000)『計量情報学 図書館/言語研究への応用』丸善株式会社.
「用語の類似」という章で扱う語彙論の中に数量化理論第IV類を用いたものがある。語彙分布の全体同士を比較して、両者の類似度を測定しているようだ。
水谷静夫(1982)『現代数学レクチャーズD-3 数理言語学』培風館.
朝倉日本語新講座2 語彙
「共出現語に基づく解析」という章で「幾つかの表現域(作品等)から用語上の資料を取って、その用語情況に基づき見出し語や表現域の相対的位置関係を明らかにする問題」を扱っている。この問題に対して「語彙論」からのアプローチを試みているが、その具体的方法は林知己夫の数量化理論に基づいたものである。
水谷静夫(1983)『朝倉日本語新講座2 語彙』朝倉書店.
Exploring Textual Data (Text, Speech, and Language Technology, V. 4.)
コレスポンデンス分析を使った内容分析法について解説している。Vocabulary and analysis for Tokyoという節では日本語での分析についても言及している。
Lebart, L., Salem. A. and Berry, L.: 1998, Exploring Textual Data, Kluwer Academic Publishers, Dordrecht.
Word Frequency Distributions (Text, Speech, and Language Technology, V. 18)
語の頻度分布から統計手法を使ってどのような分析ができるかについて丁寧に紹介してある。分析に用いる(Baayen自作の)ソフトやデータセットもいくつか付属している。これらを用いて本文中に例示された実験結果を再現できるはずなのだが、微妙に違う結果になるものもある(Through the looking-glass...関連など)。
Baayen, R. H.: 2001, Word Frequency Distributions, Kluwer Academic Publishers, Dordrecht.
工学のためのデータサイエンス入門―フリーな統計環境Rを用いたデータ解析
フリーな統計処理言語であり環境でもある「R」を使って統計について学べるように作られた統計手法についての教科書。「R」の使用はあくまで統計手法の学習補助が主たる目的であるので、この本に「R」の解説書やマニュアルとしての役割は期待すべきではないと思われる。
間瀬茂・神保雅一・鎌倉稔成・金藤浩司(2004)『工学のためのデータサイエンス入門---フリーな統計環境Rを用いたデータ解析---』数理工学社.
統計解析ソフトS-PLUSを使った統計処理法についての概説書。「多変量解析とパターン認識」の章でクラスター分析や多次元尺度構成法(MDS)についての記述がある。
W.N.ヴェナブルズ・B.D.リプリー(2001)『S-PLUSによる統計解析』シュプリンガー・フェアラーク東京株式会社.
統計解析ソフトS-PLUSについての入門概説書。「クラスター分析」に関して一章を割いており、これについてのやや詳しい解説が読める。
水田正弘・山本義郎・南弘征・田澤司(2005)『S-PLUSによるデータマイング入門』森北出版株式会社.
Copyright(c)2006 ccoe@mac.com All rights reserved.