日本語の品詞分類

出典: 謎の百科事典もどき『エンペディア(Enpedia)』
ナビゲーションに移動 検索に移動

日本語の品詞分類は、主に非・ネイティブに対する日本語教育や日本語処理に関係する問題である。固有名詞の日本語表記のルールなども参照のこと。
用言における品詞分類は日本語処理において重要な課題であるが、主に動詞・形容詞などの用言の品詞分類が課題とされていたため、「活用しない語」である「名詞」についてはあまり着目されなかった。

概要[編集]

学校文法においては、「詞(自立語)/辞(附属語)」「用言(活用するもの)/体言(活用しないもの)」といった橋本文法における品詞分類をほぼ踏襲したが、日清戦争・日露戦争などを受けてエリートの育成が急務であったため、旧制中学校用の国定教科書における文法としてはやや未完成であった。当時の優秀な若者(おもに男子)にはそれなりの教養を身につけていたわけだが、国際化による非・ネイティブに対する日本語教育やコンピューターによる日本語処理に応用しようと思うと、その問題点が明らかになってきた。なぜかといえば、学校文法は日本人のエリート教育の手段であったため、日常的な日本語の読み書きには不自由をしていない「人間」を相手にしており、「あらためて説明する」ために「日本語という言語を客体化する」必要がなかったため、記述文法というものが成立していなかったためである。これはある意味では望ましいことでもあり、「植民地の労働者には、支配者が使う言語押しつければよい」という考えかたをしなかったため、むしろ「現地語がどうなっているのか?」を日本人が考えるよりも先に現地住民が日本語を覚えるのが早かったという理由によるらしい。
もう一つの問題は、当時は説明するためのパラダイムが乏しかったため、せいぜい「木構造」くらいで済ませてしまっていたという事情もある。「活用があって述語なのだけれど附属語である」という語もあり(「だ」「です」「である」がその例である)、しかも省略が多いために接続関係だけで記述しようと思うと組合せが増えて辻褄が合わなくなってくるといった問題点が学校文法にはあった。そのため日本の国語教育における品詞分類は、一度見直さざるをえないのが現状である。

分類の基準[編集]

述語[編集]

まず、「述語であるかどうか」という基準がある。述語となるのは

  • 動詞
  • 形容詞
  • 助動詞 -「だ」「です」「である」。コピュラ((copula))という。

の三つだけである。「『単文』には必ず一つだけ述語がある」とも謂えるが、「とりあえず述語があればなんとかなる」という事でもある。「逃げろ!」は、「誰が」「何から」が明示的に示されなくても文である。
「文法」と言われて真っ先に思い浮かべるのは活用表だが、「何に係るときに、どんな形になるか」だけの話でしかない。したがって、述語は「規則らしきものが立てられない」という不規則活用が少数あり、その他は「指標音」と呼ばれる音が判れば機械的に活用がわかる。したがって述語の活用の判別精度はコンピューターのほうが圧倒的に高く、「こった」を「乞った/請った」と変換したり「とった」を「問った」とかと変換したりるるのは開発者ば馬鹿であることの証左である。

形態素[編集]

附属語であるが、その役割は多様であり、いわゆる「助詞」も含めて非・ネイティブは覚えるのに苦労しやすい。これは日本人は相手が間違っていても指摘すると失礼にあたるのではないかという理由によると思われる。その点パソコンは容赦がないので、私は日本語のネイティブだが日本語の文法はパソコンに教わったようなものである。国語教師は平気で嘘を吐くが、パソコンは嘘をつかないので文法定義や辞書分類を人間が間違えただけの話であり、日本語処理システムを開発していると「自分が馬鹿であることを思い知る」だけの話でしかない。 日本の古典文学においては、コーパスデータをくべてやると「この時代にこの用法はないだろう」という例がときどき引っかかることがあり、「書写する際に間違えた」「後世の偽書である」などが判って面白い。

名詞の分類[編集]

「山」は「やま」「さん」という二つの訓があり、「村」は「むら」「そん」という訓みがある。とはいえ日常においては省略されるなど辞書的に管理する際には、「品詞分類」が必要になる。いわゆる学校文法の基礎となる橋本文法の品詞分類のみでは日本語処理における品詞分類を網羅しきれないために、より網羅的な品詞分類が行われる。
たとえば「富士山麓」は一般的だが、神奈川県の阿夫利山の別名である「大山(おおやま)」の山麓は「大山麓」ではなく、「大山(だいせん)」の山麓は「だいさんろく」でも「だいせんろく」でもなく「大山の山麓」である。同じように、では「月山」はどうだろうかという話にはなり、同じ名詞であっても日本語処理においては別扱いする必要が生じる。
そのため「日本語処理においては、名詞の品詞分類について見直さなければならないのではないだろうか?」という意見があり、同時に日本語ネイティブではない児童・生徒に対する用言の活用指導について、見直す立場から品詞分解についての議論が起きた。
接頭語の「お」「ご」は、「やまとことばは『お』」「漢語は『ご』」が原則だが、「漢語なのに『お』がつく」という語は多い。(「お勉強」「お盆」「お線香」など)
外来語はどちらもつかないが、「おズボン」「おビール」「おタバコ」などがある。
。 「ひと」と「いち」でも「やまとことばは『ひと』」「漢語は『いち』」が原則だが「ひと騒動」「ひと段落」がある。
「おお」と「だい」でも「やまとことばは『おお』」「漢語は『だい』」が原則だが「おお騒動」「おお火事」「おお地震」がある。

周辺技術との関係[編集]

昨今のパソコンの(二次記憶も含めて)記憶領域は広く、回線環境も整っているため、こうした名詞はちゃんと分類したうえでどこかのサーバーに置いて共有すれば一度登録したら問題は解決する。どう多く見積もっても語彙数は百万語は超えない(一日百語づつ語彙が増えても二十八年かかる)ので、かな漢字変換システムはパブリックドメインにしてしまうのが経済的である。個人の環境には、使用頻度情報と方言の文法定義程度を持っておけば充分である。
ただしシソーラスの構築は必要かもしれない。昆虫の種数は百万種と云われており、これを学名と和名に紐づけてもこんどは人間が正確に入力できないという話になる。したがって、品詞分類と方言を含めた文法定義と辞書作成とは不即不離の関係にある。

参考文献[編集]

脚注[編集]


関連項目[編集]