目録システム利用マニュアル


[目次]
[前ページ] 2.7.2 検索用インデクス
[次ページ] 2.7.4 検索上の注意
[索引]

2.7.3 漢字統合インデクス

 目録システムでは、データベース内部の文字コードとしてUCS(国際符号化文字集合)を採用しています。UCSの統合漢字部分には、約2万字の漢字が含まれており、似た形や同じ意味の漢字が数多くあります。

 目録システムでは、漢字形による検索もれを防ぐため、似た字形や同じ意味の漢字を含めて検索するための仕組みとして、「漢字統合インデクス」を用意しています。

■漢字統合インデクスを使った検索処理の流れ

 検索を実行するときには、検索キーワードに対して漢字統合インデクスによる正規化を行ったのち、書誌データの検索用インデクスと照合して検索結果を表示します。

 書誌データのデータ記述は表記そのままの文字ですが、検索用インデクスは漢字統合インデクスにより正規化されたものが登録されています。これにより、漢字の表記の違いによる検索もれを防ぎ、字体の違いを意識することなく検索できます。

 なお、漢字統合インデクスは新旧両方の目録システムで機能しますので、どちらのシステムからも中国語資料の検索は可能です。



[ページの先頭]