English

利活用データにおける正規化について

利活用データでは、各機関が登録したメタデータ(ソースデータ)に含まれる「時間(いつ)」「場所(どこ)」「人や組織の名称(だれ)」の情報をできるかぎり標準的な表現に置換(正規化)しています。ジャパンサーチにおける「正規化」とは、値を実体として定義し、URI(ASCII文字以外を含むので正確にはURIの拡張版の国際化資源識別子(IRI)だが、ここではわかりやすさのためURIとして説明)による表現に置換することです。正規化に当たっては、情報を要素に分解して構造化し、外部のLODハブ(国立国会図書館の典拠データ(Web NDL Authorities)やWikidata等ウェブ上で他のデータから多くリンクされているURI)のデータと同定し、関連付けています。これにより、利活用の幅が大きく広がることを目指しています。

1. 時間情報の正規化

1-1. 時間情報のURI

時間に関する情報は、暦年を最小単位とする時間の範囲(期間)を実体として定義し、正規化しています。URIは、https://jpsearch.go.jp/entity/time/の名前空間で一意に与えられます。
  1. 例1:https://jpsearch.go.jp/entity/time/1861 (西暦1861年の1年間を範囲とする時間実体)
  2. 例2:https://jpsearch.go.jp/entity/time/室町時代 (日本史の時代区分で一般に「室町時代」と呼ばれる期間を範囲とする時間実体)

1-2 時間情報の構造化

時間に関する情報は、それを表す複数の要素(和暦などの別称、開始年、終了年など)によって構造化されます。時間情報が構造化されているプロパティにはjps:valuejps:eraがあります。

jps:value

プロパティの名前 jps:value
URI https://jpsearch.go.jp/term/property#value
説明 西暦年(1年間)、期間、世紀、時代など時間の範囲を表す。年を最小単位として正規化され、以下の下位プロパティによって詳細化される。[ ]内は、一つのjps:value内の出現回数。
rdf:type
type:Time」または「type:HistoricalEra」(値が時代の場合)と入り、構造化内のjps:valueが時間範囲についてのプロパティであることを表す。([1])
rdfs:label
該当する時間範囲の呼称。(文字列 [1])
schema:name
該当する時間範囲についての様々な名称を表す。読みや多言語名称は言語タグを付与して区別する。(文字列 [1-n])
schema:startDate
時間範囲の開始年を表す。(xsd:gYear型 [1])
schema:endDate
時間範囲の終了年を表す。単年の場合開始年と同じ値が入る。(xsd:gYear型 [1])
jps:start
開始年(schema:startDate)を整数値で表したもの。(xsd:integer型 [1])
jps:end
終了年(schema:endDate)を整数値で表したもの。(xsd:integer型 [1])
jps:startEntity
該当する時間範囲が複数年に及ぶ場合に、開始年を表す時間範囲へのリンクを表す。(URI [0-1])
jps:endEntity
該当する時間範囲が複数年に及ぶ場合に、終了年を表す時間範囲へのリンクを表す。(URI [0-1])
skos:closeMatch
時間範囲が時代である場合、時間範囲がリンク先の時間範囲(西暦年の範囲)とほぼ同値であることを表す。該当する時間範囲が、時代名や古代の年号など対応する年範囲が諸説ある場合、あるいは、区切りが年単位と一致しない場合には、この項目に値が入る。(URI [0-1])
owl:sameAs
ジャパンサーチで定義する時間範囲が、リンク先の時間範囲(オープンデータで提供されているもの)と同じであることを表す。(URI [0-n])
想定される値 type:Timetype:HistoricalEra
値の記述形式 URI(schema:temporalの値と一致)
出現回数 1メタデータ内では0-n(jps:temporal内では1)

jps:era

プロパティの名前 jps:era
URI https://jpsearch.go.jp/term/property#era
説明 時代を表す。時代は正規化され、以下の下位プロパティによって詳細化される。[ ]内は、一つのjps:era内の出現回数。
rdf:type
必ず「type:HistoricalEra」(「type:Time」のサブクラス)の値と入り、時代についてのプロパティであることを表す。([1]
rdfs:label
該当する時代の呼称。(文字列 [1])
schema:name
該当する時代についての様々な名称を表す。読みや多言語名称は⾔語タグを付与して区別する。(文字列 [1-n])
schema:startDate
時代の開始年を表す。(xsd:gYear型 [1])
schema:endDate
時代の終了年を表す。単年の場合開始年と同じ値が入る。(xsd:gYear型 [1])
jps:start
開始年(schema:startDate)を整数値で表したもの。(xsd:integer型 [1])
jps:end
終了年(schema:endDate)を整数値で表したもの。(xsd:integer型 [1])
jps:startEntity
該当する時代の開始年を表す時間範囲へのリンクを表す。(URI [0-1])
jps:endEntity
該当する時代の開始年を表す時間範囲へのリンクを表す。(URI [0-1])
rdfs:isDefinedBy
ジャパンサーチにおける時間範囲URIを定義する名前空間「https://jpsearch.go.jp/entity/time/」が入る。該当する時代がこの名前空間の中で一意に定義されていることを表す。([1])
skos:closeMatch
時代がリンク先の時間範囲(西暦年の範囲)とほぼ同値であることを表す。該当する時代に対応する年範囲が諸説ある場合、あるいは、区切りが年単位と一致しない場合には、この項目に値が入る。(URI [0-1])
owl:sameAs
ジャパンサーチで定義する時間範囲が、リンク先の時間範囲(オープンデータで提供されているもの)と同じであることを表す。(URI [0-n])
想定される値 type:HistoricalEra
値の記述形式 時間オントロジーで定義するURI
出現回数 1メタデータ内では0-n(jps:temporal内では1)

2. 場所情報の正規化

2-1. 場所情報のURI

場所に関する正規化された情報は、国または都道府県、及び市郡レベルを単位とする空間の範囲を実体として定義し、正規化しています。URIは、https://jpsearch.go.jp/entity/place/の名前空間で一意に与えられます。
  1. 例1:https://jpsearch.go.jp/entity/place/日本
  2. 例2:https://jpsearch.go.jp/entity/place/神奈川
  3. 例3:https://jpsearch.go.jp/entity/place/宮城.仙台市

2-2. 場所情報の構造化

場所に関する情報は、それを表す複数の要素(名称、緯度経度、自治体コードなど)によって構造化されます。場所情報が構造化されているプロパティには、jps:valuejps:regionがあります。

jps:value

プロパティの名前 jps:value
URI https://jpsearch.go.jp/term/property#value
説明 場所についての情報を表す。国または都道府県レベルで正規化され、以下の下位プロパティによって詳細化される。[ ]内は、一つのjps:value内の出現回数。
rdf:type
type:Place」または「type:Country」(値が国の場合)と入り、構造化プロパティ内のjps:valueが場所についてのプロパティであることを表す。([1])
rdfs:label
該当する場所の呼称。(文字列 [1])
schema:name
該当する場所についての様々な名称を表す。読みや多言語名称は言語タグを付与して区別する。(文字列 [1-n])
schema:geo
geohash.orgのURI(正規化された値に対応した範囲の位置情報を持つ。)(URI [0-n])
schema:geoCoveredBy
対象地域を含むメッシュを示すgeohashのURI。桁数が対象の粒度に対応する(都道府県、市町村、街区レベルならこの値はそれぞれ3、4、6桁のgeohash)。(URI [0-1])
schema:isPartOf
該当する場所をその一部とする、より広域の場所情報を表す。(URI [0-n])
rdfs:isDefinedBy
空間範囲が正規化されている場合に、ジャパンサーチにおける空間範囲URIを定義する名前空間「https://jpsearch.go.jp/entity/place/」が入る。該当する場所がこの名前空間の中で一意に定義されていることを表す。([0-1])
rdfs:seeAlso
該当する場所に対応する組織や法人(自治体など)がジャパンサーチで正規化されている場合に、その実体(type:Agent)と、そのほか同等の実体を表すURI(オープンデータで提供されているもの)を表す。(URI [0-n])
想定される値 type:Placetype:Country
値の記述形式 URI(国や都道府県のレベルで正規化したURI)(schema:spatialの値と一致)
出現回数 1メタデータ内では0-n(jps:spatial内では1)

jps:region

プロパティの名前 jps:region
URI https://jpsearch.go.jp/term/property#region
説明 場所についての情報を、市や郡レベルで正規化した形で表す。
rdf:type
必ず「type:Place」と入り、jps:regionが場所についてのプロパティであることを表す。([1])
rdfs:label
該当する場所の呼称。(文字列 [1])
schema:name
該当する場所についての様々な名称を表す。読みや多言語名称は言語タグを付与して区別する。(文字列 [1-n])
schema:geo
geohash.orgのURI(正規化された値に対応した範囲の位置情報を持つ。)(URI [0-n])
schema:description
該当する場所に関する説明。(文字列 [0-n])
schema:geoCoveredBy
対象地域を含むメッシュを示すgeohashのURI。桁数が対象の粒度に対応する(都道府県、市町村、街区レベルならこの値はそれぞれ3、4、6桁のgeohash)。(URI [0-1])
schema:isPartOf
該当する場所をその一部とする、より広域の場所情報を表す。(URI [0-n])
rdfs:isDefinedBy
空間範囲が正規化されている場合に、ジャパンサーチにおける空間範囲URIを定義する名前空間「https://jpsearch.go.jp/entity/place/」が入る。該当する場所がこの名前空間の中で一意に定義されていることを表す。([0-1])
rdfs:seeAlso
該当する場所と同等の組織(自治体など)がある場合にその実体と、その他同等の情報(オープンデータで提供されているもの)を表す。(URI [0-n])
想定される値 type:Place
値の記述形式 URI(市や郡のレベルで正規化したURI)
出現回数 1メタデータ内では0-n(jps:spatial内では1)

3. 人・組織情報の正規化

3-1. 人・組織情報のURI

人や組織に関する情報は、コンテンツの作成への寄与者やコンテンツの主題・被写体になった人や組織自体を実体として定義し、正規化しています。URIは、国立国会図書館名称典拠にあるものはそのURIを用い、ないものはhttps://jpsearch.go.jp/entity/chname/の名前空間で一意に与えられます。
  1. 例1:https://jpsearch.go.jp/entity/chname/足利尊氏
  2. 例2:https://jpsearch.go.jp/entity/chname/仙台市
  3. 例3:https://jpsearch.go.jp/entity/chname/国立国会図書館

3-2. 人・組織情報の構造化

人や組織に関する情報は、それを表す複数の要素(代表的な呼称、別称、同一実体を表す別のURIなど)によって構造化されます。人・組織情報が構造化されているプロパティには、jps:valueがあります。

jps:value

プロパティの名前 jps:value
URI https://jpsearch.go.jp/term/property#value
説明 コンテンツに関係する人または組織の情報についての情報を表す。以下の下位プロパティによって詳細化される。 [ ]内は、一つのjps:value内の出現回数。
rdf:type
type:Agent」または「type:Person」(値が人物にあたると判断できた場合)と入り、構造化プロパティ内のjps:valueが該当するコンテンツに関係する、もしくは該当するコンテンツの内容の主題となる人または組織についてのプロパティであることを表す。([1])
rdfs:label
該当する人または組織の呼称。(文字列 [1])
schema:name
該当する人または組織についての様々な名称を表す。読みや多言語名称は言語タグを付与して区別する。(文字列 [1-n])
rdfs:isDefinedBy
該当する人または組織が正規化されている場合に、ジャパンサーチにおける人や組織自体のURIを定義する名前空間「https://jpsearch.go.jp/entity/chname/」が入る。該当する人または組織がこの名前空間の中で一意に定義されていることを表す。([0-1])
owl:sameAs
該当する人または組織が、リンク先の人または組織の情報(オープンデータで提供されているもの)と同じであることを表す。(URI [0-n])
schema:description
該当する人または組織の説明。(文字列 [0-n])
schema:image
該当する人または組織に関する画像や写真情報などのURIを表す。(URI [0-n])
schema:location
rdfs:labelの値が所在地情報を持つ実体(美術館など)である場合に、場所情報のURIを表す。(URI [0-n])
想定される値 type:Agenttype:Person
値の記述形式 URI(ソースデータにある名称典拠URIまたはジャパンサーチで正規化したURI)(schema:agentialの値と一致)
出現回数 1メタデータ内では0-n(jps:agential内では1)