TOP活動実績2004年

(48) 誤りを含むタグ付きデータを用いた深層格の自動推測手法
   言語処理学会第10回年次大会発表論文集, pp.568-571, 2004-3

誤りが3,4割存在する深層格のタグ付きデータから,表層的な情
報のみを手がかりとして,他の事例の深層格を推測する手法を提案
する.本手法は,タグ付きデータに含まれる誤りの影響を抑制する
ために,表層的な情報を動詞,助詞パターン,助詞,名詞に分解し
て規則化し,上記の順に段階的に適用していく.また,学習データ
に含まれない動詞や名詞に対処するために,共起する助詞の頻度を
要素とするベクトルで表現し,内積による類似度に基づいて規則と
の類推を行う.67.1%の精度でタグ付けされたデータを用いて実験
した結果,59.9%の精度となり,助詞のみを手がかりとした場合の
精度56.6%に対して,僅かではあるが精度の向上が確認された.


PREVIOUS << >> NEXT