共起性を考慮に入れたかな漢字変換の試み

第8回入力メソッドワークショップ (IM 2016)に参加して発表してきた。

会場から多数コメントをいただいた。感謝いたします。

残念ながら共起情報を入れるとかえって精度が低下してしまうという結果でだったが、この点について

といった意見を頂いた。

その他の発表では、特に@yoh_okunoさんのニューラルかな漢字変換の発表が、まさにエンジンの開発というゴールが同じ発表で興味をひかれた。

ただ、私の発表資料でも指摘したとおり、ベースラインがBigramモデルでBEAMサーチによる解探索を行ったものであり、精度向上できたという主張にはやや疑問を感じた。また、品詞やトピックを学習できた、という主張についても、挙げられた例が、私のBigram Viterbiによる統計的変換エンジンでは正しく変換できているものであったため、必ずしも納得できるものではなかった。

また、発表以外でも、企業でIMEや関連APIを開発されている方が多数参加されておられ、ご意見を伺えたことは大変有意義だった。

最後に、開催に尽力された皆様に感謝します。