シソーラス
シソーラスとは、「言葉の意味の本末を示す知識ベース」である。
概要[編集]
シソーラスには二種あり、「樹状構造型」と「ネットワーク型(束型、半順序型、ハイパーリスト型)」がある。
たとえば「生物」というカテゴリーの下に「動物」があり、「動物」下に「昆虫」「爬虫類」「鳥類」「哺乳類」といった系統樹がある。これは樹状構造型のように
見えるが、「交雑種」もあるため、厳密な樹状構造にはなっていない。
これは人間が考える「現実」が、単なる樹形構造で考えると齟齬をきたすということである。そこで持ち出されたものが数学的な構造としては束ではあるのだが、このあたりはコンピューターでまともに扱おうとすると、たちまち組合せ論的爆発を起こしてメモリが不足したり処理が戻ってこなかったりして困る。
「飛ぶ動物」と「飛ばない動物」というものを考えると、「鳥類は飛ぶ」ことが言えそうだが、ペンギンやダチョウやヤンバルクイナは飛ばない。スーパーヒーローも飛びそうだがサイボーグ009 も 8マンも仮面ライダーも飛ばない。そこで「そこを何とかできないか」というので考えられたのが、「シソーラスではなく推論のほうで解決しよう」という「非単調論理」が考えられたが、なんにせよ処理の手間はかかるので、コンピュータのメモリのサイズを増やしデータフローやら並列処理やらを用いて力づくの処理をおこなうという「ブルート・フォース・アプローチ」(別名「エレファントな解法」)などにも期待はかかっている。
人間生活との関わり・利用[編集]
「四辺形」(四角形)には「凸四辺形」以外に「凹四辺形」があるが、一般的には四角形は凸四辺形をいう。
そのため「平行四辺形」「台形」「菱形」「長方形」「正方形」などの用語があるが、正方形は平行四辺形であり台形であり菱形であり長方形である。
そんなわけで、分類するときには「どっかで合流しないと面倒臭い」「定義が循環しちゃうとマズい」という話にはなる。「右大臣」は「左大臣」じゃないほうなのだが、それを言ったら「『右』と『左』ってなんなのよ」という定義の循環が起きる。
そのためにシソーラスは必須なのだが、人と手間がかかるので金もかかるため、真っ当に取組む組織はほとんどない。
けっきょくいろんな立場の人がいろいろと紛争しているので、その戦雲っちゅーか五里霧っちゅーかケンカ雲のなかでウロウロしているシソーラス派は「どっちが本でどっちが末か」を頼りにネットワーク構造を構築しつつ「定義は循環してねーよな?」とチェックを重ね、「とりあえず実用になるものが作れんかな?」と思ってはいるのだが日本語処理の技術がまだ未熟なので自然言語によるユーザーインタフェースが不完全で、人工痴脳の実用化を急いでいるのだが、ChatGPTという横槍が入って事象知識人とか頭の悪いマスコミ関係者がバカ騒ぎしているために霧は晴れるどころかますます広がるばかりである。