2010-06-10から1日間の記事一覧

CiNiiの著者名検索の精度検証

http://cinii.jp/post/486298233/cinii-author-searchどんなもんかと。日本人研究者を対象に、なるべく分野が偏らないように集計してみた。集計自体は完全に正確ではないだろうけど、誤差数%程度なんじゃないかと思う。適合率/再現率は、該当する著者の文献…

Zipfの法則を真面目に検定してみる

Zipfの法則は、「ユリシーズ」に現れる単語の出現頻度を多い順に並べると、出現頻度は概ね順位に反比例することを発見したのが始まりらしい。Zipfは“Human Behavior and the Principle of Least Effort”という本を書いて、都市の人口とかにも当てはまるとか…

x-means

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.19.3377クラスタリングの方法は、色々あるけども、わたしの知る限り、ほとんどの方法では、事前にいくつのクラスターに分かれるか決める必要がある。クラスタリングしたい多くの状況で、いくつのク…

SVM使って何かしたという論文は山ほどあるけど、十分実用的なアプリケーションでSVMが役立ってる例ってあるんだろうか。思うに、SVMの評価関数は、理解しやすいものではあるけれど、あんまり自然な感じのする代物ではない