AUTHKEY作成仕様
2023年1月31日以降の情報については、目録システム操作マニュアル 付録.C インデクス作成仕様をご覧ください。
AUTHKEYはレコードのINSERT,UPDATE時にサーバにて以下のフィールドから作成される。
INSERT,UPDATEできないレコードについても、DBへの追加時に作成されている。
- TRD
- CWA
- PTBTR
- PTBNO
- AHDNG
- AHDNGR
- AHDNGVR
- UTHDNG
- UTHDNGR
- UTHDNGVR
- HDNGD
- HDNGR
- HDNGVR
- SFD
- SFR
- SFVR
- SAFD
- SAFR
- SAFVR
それぞれのフィールドについて以下のように語の切り出しを
行ない、正規化してAUTHKEYとする。
なお、AUTHKEY作成時には以下の条件が適用される。
- ストップワードはAUTHKEYとならない。
- AUTHKEYの最大長は32文字なのでそれより長い文字列はそこでカットされる。
- 最大繰り返し数は512回なので、512に達した時点でそれ以上のAUTHKEYは
作成されない。
注:△は半角スペース。記号は全て半角。
TRD
”△/△”以降をデリミタごとに語を切り出す。
また、”△/△”以降でも以下の文字列が出現した場合、語の切り出しを中止し、
”△/△”が出現したら再開する。
△.△
△=△
なお、”△=△/△”のような場合、”△=△”の後に”△/△”が出現したと
判断する。
CWA
デリミタごとに語を切り出す。
PTBTR
JPMARC,TRCMARC,USMARC,USMARCX,GPOMARC,UKMARCの場合のみ切り出しを
行なう。
”△/△”以降の部分をデリミタごとに語を切り出す。
また、”△/△”以降でも以下の文字列が出現した場合、語の切り出しを中止し、
”△/△”が出現したら再開する。
△.△
△=△
なお、”△=△/△”のような場合、”△=△”の後に”△/△”が出現したと
判断する。
PTBNO
”△/△”以降の部分をデリミタごとに語を切り出す。
また、”△/△”以降でも以下の文字列が出現した場合、語の切り出しを中止し、
”△/△”が出現したら再開する。
△.△
△=△
||
△;△
{△
が出現した場合は
△}
が出現するまで、
△;△
は無視する。
なお、”△=△/△”のような場合、
”△=△”の後に”△/△”が出現したと判断する。
AHDNG
デリミタごとに語を切り出す。
AHDNGR、AHDNGVR
デリミタごとに語を切り出す。
AHDNGとAHDNGR
AHDNGを、AHDNGRの語分割を参考にして切り出す。
UTHDNG
以下の文字列が出現する場合、それ以前を切り出す。
△??△
UTHDNGR、UTHDNGVR
以下の文字列が出現する場合、それ以前を切り出す。
△??△
UTHDNGとUTHDNGR
UTHDNGのAUTHKEYを作成する部分を、UTHDNGRのAUTHKEYを切り出す部分の
語分割を参考にして切り出す。
HDNGD
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
HDNGR、HDNGVR
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
HDNGDとHDNGR
HDNGDのAUTHKEYを作成する部分を、HDNGRのAUTHKEYを切り出す部分の
語分割を参考にして切り出す。
SFD
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
SFR、SFVR
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
SFDとSFR
SFDのAUTHKEYを作成する部分を、SFRのAUTHKEYを切り出す部分の
語分割を参考にして切り出す。
SAFD
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
SAFR、SAFVR
デリミタごとに語を切り出す。
但し、TITLE,USMARCTの場合は以下の文字列が出現する場合のみ
、それ以前を切り出す。
△??△
SAFDとSAFR
SAFDのAUTHKEYを作成する部分を、SAFRのAUTHKEYを切り出す部分の
語分割を参考にして切り出す。