TOP活動実績1998年

(22) 文字情報縮退方式を用いた帰納的学習によるべた書き文のかな漢字変換手法
     情報処理学会第57回(平成10後期)全国大会, 講演論文集(2),pp.197-198,1998-10.

 近年の利用者の需要と技術の進歩から小型の携帯端末が登場してきた。中にはその入力を10個の数字キーとその補助を行うわずかな特殊キーによってのみ行う携帯性に非常に優れたものがある。最近の携帯端末での電子メール利用率の増大からもこの少数のキーで軽快に日本語文章の入力ができるかな漢字変換手法の開発が望まれる。
 この問題に対して我々は「文字情報縮退方式を用いた帰納的学習によるべた書き文のかな漢字変換手法」を提案する。文字情報縮退方式[1]とは50音のかな文字を0~9、#、*の12のキーそれぞれに複数対応させ日本語文を入力する手法である。かな文字1文字の入力を1ストロークで行うことができ、軽快な入力が可能である。また本手法においては、システムが帰納的学習により話を自動的に獲得するので初期辞書の作成は必要なく、使用者個人に合わせた辞書が自動的に生成される[2]。
 文字情報縮退方式は、軽快な操作性実現のために母音情報が縮退し、情報が失われた形になっている。そのためかな漢字変換に際して、この失われた情報をいかにして回復するかが重要となる。これに対して我々は、すでに開発済みの帰納的学習を用いた手法[2]による解決を試みた。この手法においては対象を限定することにより、システムが帰納的学習によって自動的にその対象に適応していく。しかし、これだけでは十分な精度は得られなかった。そこで帰納的学習による語の獲得を中心としながらも付随する他の情報を学習することによって、失われた情報の回復を試みることにした。従来の手法に比べて新しく学習する具体的な情報は、隣接文字情報と語の読みの文字数である。前者は、以前に入力された数字べた書き文、校正済みの変換結果からn-gram統計[3] [4]により獲得され、かな漢字変換に利用される。これにより先行、後続文字列とのつながりを考慮した変換が可能となっている。後者は、校正済みの変換結果のかなに対応する、入力数字べた書き文中の数字列の位置の推測に利用される。これにより従来より多くの語を獲得することができる。
 本稿では本手法の概要及びその有効性を確認するために行った評価実験結果について述べる。
PREVIOUS << >> NEXT