(48) 誤りを含むタグ付きデータを用いた深層格の自動推測手法
       言語処理学会第10回年次大会発表論文集,
    pp.568-571, 2004-3
    
    誤りが3,4割存在する深層格のタグ付きデータから,表層的な情
    報のみを手がかりとして,他の事例の深層格を推測する手法を提案
    する.本手法は,タグ付きデータに含まれる誤りの影響を抑制する
    ために,表層的な情報を動詞,助詞パターン,助詞,名詞に分解し
    て規則化し,上記の順に段階的に適用していく.また,学習データ
    に含まれない動詞や名詞に対処するために,共起する助詞の頻度を
    要素とするベクトルで表現し,内積による類似度に基づいて規則と
    の類推を行う.67.1%の精度でタグ付けされたデータを用いて実験
    した結果,59.9%の精度となり,助詞のみを手がかりとした場合の
    精度56.6%に対して,僅かではあるが精度の向上が確認された.