CATP/1.1サーバ(多言語対応サーバ)実装仕様解説

Last Update: 1999.11.16
  1. はじめに
  2. UCS対応
  3. CATPエンコーディングの追加
  4. 漢字統合インデクスの実装
  5. フィールドの新設
  6. CATP/1.1対応
  7. CHINA-MARC対応


この資料は,平成12年1月から稼動する,CATP/1.1対応の新CAT/ILLシステム多言語対応サーバの実装仕様について解説するものである。
CATP/1.1仕様書


多言語対応サーバ内部で使用する文字コードを,EUCからUCSに変更する。
このサーバで使用するUCSは,以下の仕様とする。

クライアントが使用する文字コードとサーバ内部の文字コード(UCS)との変換は,CATPエンコーディングの指定により多言語対応サーバで行う。
このUCS変換は双方向の変換であり,CATPリクエスト時とCATPレスポンス時に実行される。
クライアント文字コードに変換できない文字を,UCS外字という。これは,◆でUCSコード値をはさんだ形に変換する。


従来のサーバでは,JIS7エンコーディングだけに対応していたが,新たにGB,GBK,UTF8,ISO2022JPの4種類のエンコーディングに対応可能となった。
CATP/1.1対応エンコーディング一覧


UCSの漢字統合部分には,約2万字の漢字が含まれており,似た形や同じ意味の漢字が数多くある。このことによる検索漏れを防ぐため,似た形や同じ意味の漢字を含めて統合検索を可能とするのが,漢字統合インデクスである。


新設したフィールドは,2種類ある。(データベースフィールド定義


新設フィールドに対応していないクライアントにより,レコードが更新されてしまうと,新設フィールドのデータが欠落するという問題が生じる。それに対処するために,スキーマバージョンという仕掛けを導入した。
CATP/1.1対応スキーマバージョン

平成12年1月に新設されたフィールドのスキーマバージョンは,「2」となる。
CATP/1.0およびCATP/1.1スキーマバージョン「1」対応のクライアントでは,検索以外のすべての操作がエラーとなる。
CATP/1.0およびCATP/1.1スキーマバージョン「1」対応のクライアントで,スキーマバージョン「2」のフィールドを含むレコードを検索した場合,「2」のフィールドも返戻される。


参照ファイルとしてCHINA-MARCを追加した。
データベース名は,「CHMARC」である(データベース名定義)。