検索用インデクスとは、総合目録データベースに登録されたデータから一定の規則に従って作成された、検索用のデータです。検索画面で入力した検索キーは、検索用インデクス作成規則と同一の方式で変換されます。変換された検索キーは、検索用インデクスと照合され、その結果一致したデータが検索結果として表示されます。
目録システムでは、検索キーと検索用インデクスを同一の規則で作成・照合することにより、検索もれを防ぐ仕組みを持っています。
検索用インデクスは、データのどのフィールドのデータ要素から作成されるかによって、以下の3種類に分けられます。
データ要素がそのまま検索用インデクスとなります。
ただし、一部のコード(可変長フィールドのデータ要素)では、データ要素を分割して検索用インデクスを作成します(例2)。
データ要素 | 検索用インデクス | |
例1 | ISBN:0674471768 | 0674471768 |
例2 | TXLL:gerfrespa | ger fre spa |
データ要素を以下の規則に従って作成したものが検索用インデクスとなります。
1 語の切り出し
データ要素 | 検索用インデクス | |
例1 | データベース | データベース |
例2 | データ・ベース | データ ベース* |
* デリミタである中黒(・)の位置で、語が分割されています。
2 切り出した文字の変換(正規化)
ただし、記号(長音・ダッシュ・ハイフン・マイナス)の1文字前が、カタカナまたはひらがな以外の場合、以下の3通りの検索用インデクスが作成されます。
− 記号を除去した語データ要素 | 検索用インデクス | |
例1 | American | AMERICAN |
例2 | ふぁいる | フアイル |
例3 | ドイツ | ドイツ |
例4 | tätig | TATIG |
例5 | Œuvres | OEUVRES |
例6 | L’ITALIA | ITALIA |
例7 | ワーグナー | ワグナ |
例8 | DATA-BASE | DATABASE DATA BASE |
例9 | by-product | BYPRODUCT PRODUCT |
例10 | l’ enseignement à la carte | ENSEIGNEMENT A CARTE |
また漢字単語の場合、ヨミの分かちを基準に漢字単語用のインデクスが作成されます。
データ要素 | 検索用インデクス | |
例 | 新潮文庫 || シンチョウ ブンコ | 新潮 シンチヨウ 文庫 ブンコ |
主要データは、以下の規則に従って作成されます。
1 語の切り出し
2 切り出した文字の変換(正規化)
切り出した文字 | 変換後 |
ローマ字・ギリシャ文字・ロシア文字の小文字 | 大文字 |
2バイト英数字 | 1バイト英数字 |
1バイトカナ | 2バイトカナ |
3 以下の特定文字の除去
4 AKEYの作成
条件 | 和資料(TTLLが「jpn」でTRにヨミがある場合)/日本名典拠(ヨミがある場合) | 洋資料/日本名以外の典拠(左記の条件以外の場合) | ||
データセット | 1・3・5方式 | 3・1・1・1方式 | 3・1・1・1方式 | |
書誌 | タイトル+タイトル関連情報+責任表示 | タイトルのヨミ+タイトル関連情報のヨミ | タイトル+タイトル関連情報+責任表示 | タイトルのヨミ+タイトル関連情報のヨミ |
典拠 | 典拠形アクセス・ポイント | 典拠形アクセス・ポイントのヨミ | 典拠形アクセス・ポイント |