NLP

対数共起頻度のSVD

NLP

対数共起頻度を用いた四項類推:word2vecとPMI との比較 https://doi.org/10.11517/pjsai.JSAI2020.0_4Rin177という報告を読んだ。四項類推は、queen-woman+man ≒ kingみたいなタイプの類推問題。word2vecは、この手の問題によく答えられるということになっ…

単語の分散表現を使った教師なし単語翻訳

NLP

論文)Word Translation Without Parallel Data https://arxiv.org/abs/1710.04087実装)facebookresearch/MUSE https://github.com/facebookresearch/MUSE 単語に実ベクトルを対応させるword embeddingsは、単語の分散表現の工学的な実現のように思われている…

日本語/英語の組み合わせ範疇文法パーサーを作った

NLP

toyccg https://github.com/vertexoperator/toyccg 英語については、CCG(Combinatory Categorial Grammar)のparserは公開されているものが、いくつか存在する(疑問文とか命令文は、あんまり対応してなかったりする。toyccgも疑問文や命令文は、あんまり対応…