TOP活動実績1998年

(24) 多段階類似性判定手法におけるしきい値の最適化 情報処理シンポジウム’98,34,pp67-68,1998-5.

 現在、様々な機械翻訳システムが考案され、実用化されているが翻訳の精度及び品質が十分とは言えない。そこで我々は主な手法である解析型ではなく、学習型の機械翻訳システムの精度の向上を目指すために、遺伝的アルゴリズムを用いた実例からの帰納的学習による機械翻訳手法(GA-ILMT)の開発、研究を行っている[1]。GA-ILMTの有効性は既に確認されているが、翻訳精度に問題が残されている。GA-ILMTでは、既存の翻訳例を用いて遺伝的アルゴリズムの処理過程の一つである交叉を用いて多様な翻訳例を生成する。しかし、生成される翻訳ルールには大量の誤った翻訳例が含まれるため、これらの翻訳例から獲得される翻訳ルールにも大量の誤りが生じる。これが原因となり辞書中に誤った翻訳ルールが大量に存在するため、正翻訳結果の生成を妨げGA-ILMTの翻訳精度に影響を及ぼすのである。
 そこで、我々は、GA-ILMTに多段階類似性判定手法を適用し、類似性の判定を用いた翻訳例の交叉によってこの問題の解決を試みた。本稿では、類似性の判定のしきい値を変化させ、翻訳率を最大にする最適なしきい値について調査した評価実験の結果と最適なしきい値を用いた類似性の判定の有効性について述べる。
PREVIOUS << >> NEXT