ファクタ検出エンジン(FDE)
概要
・ファクタ検出エンジン(FDE)は、文書から文を抽出することを目的とする。
・文書とは「参照されることを前提として記録される情報である。」出典:wikipedia
・文とは「一つの完結した言明を表す言語表現の単位である。基本的には主語と述語(一方が省略されることもある)からなる。ただし、これに加えて話題(主題、題目)が重視される場合もある。」出典:wikipedia
文と文の構造的比較を行う
・入力文は、日本語文(単文、重文、複文、重複文、単語のみ)これをテキストという
・比較対象文は、入力文と同様に日本語文
・入力文に比較対象文が含まれているかを判定する
・比較対象文をファクタと呼び、本仕組みを「ファクタ検出エンジン」と呼ぶ
構文解析器によるフラット化
フラット化とは、日本語の重文・複文を単文に分割し、文の構造をコンピュータにとって理解しやすい形にすること。