(16) 文字情報縮退方式を用いた帰納的学習によるべた書き文のかな漢字変換手法の性能評価
情報処理学会自然言語処理研究会,128-1,pp.1-7,1998-11.
本手法は,文字情報縮退方式で入力された数字列を漢字かな混じり文に変換するものである.文字情報縮退方式において,0〜9,*,#の12個それぞれの文字には複数のかなが割り当てられており,読みがな1文字の入力を1ストロークで行うことが出来る.さらに入力された数字列と校正済みの変換結果から帰納的学習により語を獲得するので,辞書が空の状態からでも対象分野に適応した辞書が自動生成される.そして,母音情報縮退により失われた情報を,帰納的学習による適応能力に加え,隣接文字情報と位置推定処理により回復している.
Our proposed method translates the strings of numbers inputed by the degenerated
keywords into Japanese sentences. Each keyword in 0,1,…,9,* and # means some Kana
characters. Therefore we can input a Kana character by only one stroke. This automatically
generates the dictionary adapted to the target field, even if it is empty at first.
Because this obtains words using inductive learning to compare the strings of
numbers and proofread translation results. And this recovers the lost information
for degeneration of a vowel by inductive learning, information of neighboring
character strings and position presuming process.