hinekure.net が http://hspdev-wiki.net/ から自動クローリングした結果を表示しています。画像やリソースなどのリンクが切れています。予めご了承ください。 |
+ | 自然言語処理 |
. 日本語文法 †字は、言語の最小単位。
同じ字で構成される同じでない語。 「りんごが赤い。」の「が」と、「赤いが、甘くない。」の「が」。 自立語と非自立語が在ります。非自立語は付属語とも呼びます。
文節は自立語から自立語までです。 「お店」などの例外も在ります。
文節は語に係ります。語は文節を受けます。
文節と語の係り受けを別に説明すると、語と語の関係です。
同じ字で構成されている同じでない格語も在ります。
被述語を含んでいる文節を被述文節と呼んで、補述語を含んでいる文節を補述文節と呼んで、述語を含んでいる文節を述文節と呼ぶことにします。 「小魚をえさに、大魚を釣る。」の場合、「えさに」の後に「して」という述語を含んでいる部分が省略されています。 表現が省略される述語は「する」くらいです。 単文は、述語が単数である文です。
述文節が、別の文の被述語や補述語に係っている文が、複文です。
「りんごをお店で買いました。」
文は文節と語の係り受けの樹構造で表現できます。
樹構造を表で表す場合は、項目毎に文節を入れます。文節が右の文節の自立語に係っていることを表します。右が空白である場合は、その空白の下の文節の自立語に係っていることを表しています。そのように、同じ文節の自立語である場合は空白にします。 「りんごを広いお店で買いました。」
「広いお店でりんごを買いました。」
機械が処理しやすい樹構造の表現は、( *, * )*でしょう。 「りんごをお店で買いました。」 ( りんごを, お店で )買いました。 「りんごを広いお店で買いました。」 ( りんごを, ( 広い )お店で )買いました。 「広いお店でりんごを買いました。」 ( ( 広い )お店で, りんごを )買いました。 「りんごを大工さんが木で作ったお店で買いました。」 ( りんごを, ( 大工さんが, 木で )作った )お店で )買いました。 日本語での表現と順番も合っているし、一行で表し得るので、人が理解しやすくて、機械が処理しやすいです。 「りんごをお店で買いました。」を「( りんごを, お店で )買いました。」にしたように、文節の区切りや階層構造を示す言語知識を入れることで、機械が自然言語を処理しやすくなりました。そもそも特に格助詞などの非自立語は、言語表現に入れている言語知識です。
語を-で区切ります。 「りんごをお店で買いました。」 ( りんご-を, お-店-で )買い-まし-た-。 「私が、作者です。」 ( 私-が )作者-です-。 「私が、有名な作者です。」 ( 私-が, 有名-な )作者-です-。 「( りんご-を, お-店-で )買い-まし-た-。」などの被述語がない場合は、「( お-店-で, りんご-を )買い-まし-た-。」のように、同じ階層の文節は順番を変え得ますけど、被述語が在る場合、「( 有名-な, 私-が )作者-です-。」のようにはし得ません。 「お店で買って、お店で食べた。」 ( ( お-店-で )買っ-て, お-店-で )食べ-た-。 複文には必ず逆格が在ります。日本語の慣用では表現されません。 ( ( 私-が )買っ-た-ヲ )りんご 「りんごを買った私」 ( ( りんご-を )買っ-た-ガ )私 「りんごを買った優しい私」 ( ( りんご-を )買っ-た-ガ, 優しい-ガ )私 後で日本語に変換する場合に対応すると良さそうと考えています。 ( 私-が, りんご-を, みかん-を )買い-まし-た-。 「私が赤いりんごと小さいみかんを買いました。」 ( 私-が, ( 赤い-ガ )りんご-を, ( 小さい-ガ )みかん-を )買い-まし-た-。 |