English

利活用データにおける正規化について

利活用データでは、各機関が登録したメタデータ(ソースデータ)に含まれる「時間(いつ)」「場所(どこ)」「人や組織の名称(だれ)」の情報をできるかぎり標準的な表現に置換(正規化)しています。ジャパンサーチにおける「正規化」とは、値を実体として定義し、URI(ASCII文字以外を含むので正確にはURIの拡張版の国際化資源識別子(IRI)だが、ここではわかりやすさのためURIとして説明)による表現に置換することです。正規化に当たっては、情報を要素に分解して構造化し、外部のLODハブ(国立国会図書館の典拠データ(Web NDL Authorities)やWikidata等ウェブ上で他のデータから多くリンクされているURI)のデータと同定し、関連付けています。これにより、利活用の幅が大きく広がることを目指しています。

1. 時間情報の正規化

時間に関する情報は、暦年を最小単位とする時間の範囲(期間)を実体として定義し、正規化しています。URIは、https://jpsearch.go.jp/entity/time/の名前空間で一意に与えられます。
  1. 例:https://jpsearch.go.jp/entity/time/1861 (西暦1861年の1年間を範囲とする時間実体)
正規化の対象 西暦年(1年間、複数年間)、世紀、時代など、時間の範囲の実体。年を最小単位として正規化される。
URI例
正規化値のクラス ジャパンサーチで定義する「type:Time」。それに加えて、世紀の場合は「type:Century」、時代の場合は「type:HistoricalEra」。(「type:Century」と「type:HistoricalEra」は「type:Time」のサブクラス。)
プロパティ 各プロパティの説明の末尾の( )に値の型と[出現回数]を記載した。
rdf:type
正規化対象の区分を示す情報。値は「正規化値のクラス」を参照。(URI [1-n])
rdfs:label
該当する時間範囲を識別する名前。(文字列 [1])
schema:name
該当する時間範囲についての様々な名称。言語タグを付与する。(文字列 [1-n])
schema:startDate
時間範囲の開始年。単年の場合、終了年と同じ値を持つ。(xsd:gYear型 [1])
schema:endDate
時間範囲の終了年。単年の場合、開始年と同じ値を持つ。(xsd:gYear型 [1])
jps:start
開始年(schema:startDate)を整数値で表したもの。(xsd:integer型 [1])
jps:end
終了年(schema:endDate)を整数値で表したもの。(xsd:integer型 [1])
jps:startEntity
該当する時間範囲が複数年の場合に、開始年を表す時間範囲と関連付ける(リンクする)。単年の場合はこのプロパティを持たない。(URI [0-1])
jps:endEntity
該当する時間範囲が複数年の場合に、終了年を表す時間範囲と関連付ける(リンクする)。単年の場合はこのプロパティを持たない。(URI [0-1])
skos:closeMatch
該当する時間範囲が、時代や元号など対応する年範囲が諸説ある場合や、区切りが年単位と一致しない場合に、この項目に西暦年の時間範囲と関連付け(リンクし)て、その範囲とほぼ同値であることを表す。(URI [0-1])
owl:sameAs
ジャパンサーチで定義する時間範囲が、リンク先の時間範囲(ジャパンサーチ外のサービスでオープンデータとして提供されているデータ)と同じであることを表す。(URI [0-n])
schema:isPartOf
該当する時間範囲をその一部とする、より広い範囲の時間情報。(URI [0-n])
rdfs:isDefinedBy
該当する時間範囲が時代の場合に、ジャパンサーチにおける時間範囲のURIを定義する名前空間「https://jpsearch.go.jp/entity/time/」を持つ。該当する時代がこの名前空間の中で一意に定義されていることを表す。(URI [0-1])
正規化した実体を値に取り得るプロパティ
  • schema:temporal
  • jps:temporal/jps:value
  • jps:temporal/jps:era

参考. 元号の実体

元号を実体(ジャパンサーチで定義する「type:Time」と「type:CalendarEra」のインスタンスとなる実体)として定義し、西暦年の時間範囲の実体と関連付けています。これにより、その元号の時間範囲に含まれる時間情報を値に持つデータを検索することができます。
  1. 例:https://jpsearch.go.jp/entity/time/元禄 (元号「元禄」)
  2. 元号の正規化データを用いた検索例:プロパティパス「schema:temporal/schema:isPartOf」を用いて、元号「元禄」の時間範囲に含まれる時間情報を値に持つデータを検索する検索(検索結果にリンク

    年単位の実体と関連付けているため、元号の時間範囲に絞った検索ができます。

2. 場所情報の正規化

場所に関する情報は、国または都道府県、及び市郡レベルを単位とする空間の範囲を実体として定義し、正規化しています。URIは、https://jpsearch.go.jp/entity/place/の名前空間で一意に与えられます。
  1. 例:https://jpsearch.go.jp/entity/place/日本
正規化の対象 場所の情報が示す空間の範囲の実体。国、都道府県、市、郡のレベルで正規化される。日本の旧国名は複数都県に相当する場合には旧国名で正規化される。(旧国名が都道府県と1対1で対応する場合は旧国名ではなく都道府県で正規化される。)
URI例
正規化値のクラス ジャパンサーチで定義する「type:Place」。それに加えて、国の場合は「type:Country」。(「type:Country」は「type:Place」のサブクラス。)
プロパティ 各プロパティの説明の末尾の( )に値の型と[出現回数]を記載した。
rdf:type
正規化対象の区分を示す情報。値は「正規化値のクラス」を参照。(URI [1-n])
rdfs:label
該当する場所を識別する名前。(文字列 [1])
schema:name
該当する場所についての様々な名称。言語タグを付与する。(文字列 [1-n])
schema:geo
正規化値に対応した範囲の位置情報のメッシュを示すgeohash(geohash.orgで公開)のURIを持つ。(URI [0-n])
schema:geoCoveredBy
正規化対象の範囲を含む位置情報のメッシュを示すgeohashのURIを持つ。geohashの桁数が対象の粒度に概ね対応する(都道府県、市町村、街区レベルならこの値はそれぞれ3、4、6桁のgeohash)。(URI [0-1])
schema:isPartOf
該当する場所をその一部とする、より広域の場所情報。(URI [0-n])
rdfs:isDefinedBy
ジャパンサーチにおける空間範囲のURIを定義する名前空間「https://jpsearch.go.jp/entity/place/」を持つ。該当する場所がこの名前空間の中で一意に定義されていることを表す。([0-1])
rdfs:seeAlso
該当する場所に対応する組織や法人(自治体や建物など)がジャパンサーチで組織の情報として正規化されている場合に、組織の情報の正規化値(type:Agent)のURIと、そのほか同等の実体(ジャパンサーチ外のサービスでオープンデータとして公開されているデータ)のURIを持つ。(URI [0-n])
schema:url
都道府県のレベルで正規化した場合、自治体に対応する標準地域コードによるURIを持つ。(URI [0-1])
正規化した実体を値に取り得るプロパティ
  • schema:spatial
  • jps:spatial/jps:value
  • jps:spatial/jps:region

3. 人・組織情報の正規化

人や組織に関する情報は、国立国会図書館名称典拠にあるものはそのURIを用い、ないもののうち、出現頻度の高いものについては、コンテンツの作成への寄与者やコンテンツの主題・被写体になった人や組織を実体として定義し、正規化しています。URIは、https://jpsearch.go.jp/entity/chname/の名前空間で一意に与えられます。
  1. 例:https://jpsearch.go.jp/entity/chname/足利尊氏
正規化の対象 人や組織(自治体等を含む)の名称が示す実体。
URI例
正規化値のクラス ジャパンサーチで定義する「type:Agent」。それに加えて、人の場合は「type:Person」。(「type:Person」は「type:Agent」のサブクラス。)
プロパティ 各プロパティの説明の末尾の( )に値の型と[出現回数]を記載した。
rdf:type
正規化対象の区分を示す情報。値は「正規化値のクラス」を参照。(URI [1-n])
rdfs:label
該当する人または組織を識別する名前。(文字列 [1])
schema:name
該当する人または組織についての様々な名称。言語タグを付与する。(文字列 [1-n])
rdfs:isDefinedBy
ジャパンサーチにおける人や組織のURIを定義する名前空間「https://jpsearch.go.jp/entity/chname/」を持つ。該当する人または組織がこの名前空間の中で一意に定義されていることを表す。(URI [1])
owl:sameAs
ジャパンサーチで定義する人または組織が、リンク先の人または組織の情報(ジャパンサーチ外のサービスでオープンデータとして公開されているURI)と同じであることを表す。(URI [0-n])
schema:description
該当する人または組織の説明。(文字列 [0-n])
schema:image
該当する人または組織に関する画像や写真情報などのURIを持つ。(URI [0-n])
schema:location
正規化対象が所在地情報を持つ実体(美術館など)である場合に、空白ノードを介してgeohash(geohash.orgで公開)のURI(2. 場所情報の正規化「プロパティ」を参照)など場所に関する情報を構造化して持つ。また、自治体等が正規化対象である場合に、対応する場所の正規化値(type:Place)のURIを持つ。(URI [0-n])
rdfs:seeAlso
該当する人または組織が、リンク先の人または組織の情報の正規化値(type:Agent)と関連がある場合に、そのURIを持つ(役者と名跡、大学図書館と大学など)。また、都道府県のレベルで正規化した場合、自治体に対応する標準地域コードによるURIを持つ。(URI [0-n])
正規化した実体を値に取り得るプロパティ
  • schema:contributor
  • schema:creator
  • schema:publisher
  • schema:about
  • jps:agential/jps:value

最終更新日: