統制語彙
対象の情報群を用意した用語の集合に関連付けることで(情報群の)収拾・構造化及びその記述を図る語彙体系
統制語彙[1]:30 [2]:62(とうせいごい、英: controlled vocabularies)又は統制語[3]:716(とうせいご、英: controlled term; CT)とは、対象の情報群を用意した用語の集合に関連付けることで(情報群の)収拾・構造化及びその記述を図る[4]:443語彙体系である。
同義語や表記揺れがある自由語[3]:716(英: free term; FT)又は非統制語彙[5]と対比的に用いられる[6]。
概要
編集範列的曖昧性を次のような段階で制御できる[2]:63。
- 文法的変種の統制
- 表記揺れに対する優先語の設定
- 優先語間の階層構造等の構築
時折、第二段階(暗黙的に第一段階を包有する)だけを意識して、「表記揺れを統制した語彙」などと表現される[7]:x。
特徴
編集利点
編集- 検索漏れの防止
- 同義語や語形変化を統制してある[8]:3ので、表現の違いによる検索漏れを防ぐことができる[9]。
- 〝雑音〟の少ない検索結果
- (自由語による検索などとは異なり)文書の全内容を闇雲に探索するのではなく、文書作成者が意図的に選択、賦与した語彙による検索を主軸とする[10]為に、検索結果に目的としない余計な情報が混ざりにくくなる[9]。
- 網羅的検索[3]:718
問題点
編集例
編集他体系との連関
編集自由語
編集統制語彙と対照をなす性質故に長短が逆転する自由語は、屡々統制語彙と適宜併用され[3]:716、 双方の利点を兼ね備えた〝折衷〟体系として実務に応用されている[18]。
特に統制語彙が苦手とする専門用語や新しい概念の索引として自由語が利用される傾向がある[19]。
民衆分類との連関
編集民衆分類は利用者が主体的に附加する語彙体系であり、 集合知の代表格と見做されている[20]:1217。 その民主性によって前述の乖離を解消すること等が期待されている[2]:66。
Webなど、タグ付けに統制語彙を用いるのが実際上又経済上の理由から困難である環境においては、 情報の整理・分類に、民衆分類が次善策として[注釈 3]用いられる[21]:240。
脚注
編集注釈
編集- ^ 統制語彙を作成する際は、想定される利用者に向けて、語彙の目的・対象について編纂者が意図を表明したり(作成方針)、語彙作成の経緯・手段についての具体的に記述する(作成方法)する必要がある[12]:828
- ^ 例えば、癩病は1996年頃からハンセン病と呼び換えれており、少なくとも1999年頃までには一般利用者から指摘がある[13]程度には改名後の名称が浸透していたが、国立国会図書館件名標目表において癩病がハンセン病に改名されたのは2003年になってからである[14]。
- ^ 民衆分類の使用が「次善」なのは、統制語彙の特徴であり利点である同義語・多義語の統制や階層化がほとんど行われていない[21]:240為である。
出典
編集- ^ JISX0701 2005.
- ^ a b c d 岸田 2007.
- ^ a b c d e 岡野 1990.
- ^ a b 武田 2011.
- ^ 畠山 et al. 1989.
- ^ 長屋 et al. 2011.
- ^ INPIT.
- ^ a b 常世田 2010.
- ^ a b 九大 2019.
- ^ 細野 1996.
- ^ 岸田 1998.
- ^ 山崎 et al. 1993.
- ^ a b ICU 1999.
- ^ NDLA 2017.
- ^ 渡邊 2011.
- ^ NDL.
- ^ DCMI 2012.
- ^ 西垣 1987.
- ^ 片岡, 志賀 & 園田 1984.
- ^ 大向 2006.
- ^ a b 緑川 2007.
参考文献
編集- 武田英明「Web時代の識別子と典拠を考える(<特集>典拠・識別子の可能性:ウェブ・オントロジーとの関わりの中で)」『情報の科学と技術』第61巻第11号、情報科学技術協会、2011年11月1日、441-446頁、doi:10.18919/jkg.61.11_441、2020年4月20日閲覧。
- 細野公男「索引作業の今日的特徴と課題(<特集>統制索引語に未来はあるか?)」『情報の科学と技術』第46巻第11号、情報科学技術協会、1996年11月1日、606-612頁、doi:10.18919/jkg.46.11_606、2020年4月20日閲覧。
- 岸田和明「インターネット時代における統制語彙の意義と役割(<特集>統制語彙・シソーラスの現在)」『情報の科学と技術』第57巻第2号、情報科学技術協会、2007年2月1日、62-67頁、doi:10.18919/jkg.57.2_62、2020年4月20日閲覧。
- 常世田 良「市民はコンテンツにたどりつけるのか?-検索技術・システム-」(PDF)『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会/技術に関するワーキングチーム(第3回)』議事録、4巻、総務省、2010年4月27日。2019年9月20日閲覧。
- 岸田和明『情報検索の理論と技術』勁草書房、1998年10月。ISBN 978-4-326-04802-1。
- https://web.sfc.keio.ac.jp/~yofukami/y_fukami_master_thesis.pdf - p.26に岸田1998に掲載されている統制語と自由語の長所・短所
- 大向一輝「Web2.0の現在と展望 : 3.Web2.0と集合知」『情報処理』第47巻第11号、2006年11月15日、1214-1221頁、NCID AN00116625、NCID AN00116625、2020年4月20日閲覧。
- 山崎久道、高橋正美、原田智子、藤田節子、横山亮一、吉野敬子「ユーザーの視点からみたシソーラス評価の可能性(特集:インデクシングを考える)」『情報の科学と技術』第43巻第9号、一般社団法人 情報科学技術協会、1993年9月1日、824-842頁、doi:10.18919/jkg.43.9_824、2020年4月20日閲覧。
- 片岡彰博; 志賀泰司; 園田陽『昭和58年度 JOISユーザアンケート集』(レポート)1984年1月。
- 緑川信之「フォークソノミーの新奇性はどこにあるのか(<特集>図書館情報学の研究動向と新たな流れ)」『情報の科学と技術』第57巻第5号、一般社団法人 情報科学技術協会、2007年5月1日、238-243頁、doi:10.18919/jkg.57.5_238、2019年9月20日閲覧。
- 長屋俊、林豊、大谷周平、板橋慶造「統制語か自由語か?; ウェブで件名標目とシソーラスを利用するためのJavaScriptライブラリ」『Code4Lib Journal』第15巻、2011年10月、2019年9月11日閲覧。
- 畠山敦、川口久光、加藤寛次、藤澤浩道「自由語検索のための同義語・異表記展開方式」『全国大会講演論文集』第39巻ソフトウェア、1989年10月16日、1077頁、NCID AN00349328、2019年9月11日閲覧。
- 渡邊隆弘「典拠コントロールとオントロジー : 豊かな情報アクセスのための基盤(<特集>典拠・識別子の可能性:ウェブ・オントロジーとの関わりの中で)」『情報の科学と技術』第61巻第11号、2011年11月1日、434-440頁、doi:10.18919/jkg.61.11_434、2020年4月20日閲覧。
- 岡野弘行「これからの情報担当者 [第8回]」『情報管理』第33巻第8号、1990年、715-733頁、doi:10.1241/johokanri.33.715、2020年4月20日閲覧。
- 西垣 幸雄「内総合技術情報システム (SGJ) の構築」『情報科学技術研究集会発表論文集』第24巻、1987年10月、15-24頁。
- “Q&A 1999年分”. 国際基督教大学図書館 (1999年). 2019年9月11日閲覧。
- “シソーラス参照”. 九州大学附属図書館 (2019年9月19日). 2019年9月20日閲覧。
- 「おわりに/付属資料」『調査研究等の報告書』(レポート)独立行政法人工業所有権情報・研修館 。2019年9月11日閲覧。
- 例
- “Web NDL Authoritiesについて”. 国立国会図書館. 2019年9月20日閲覧。
- “DCMI Metadata Terms”. DCMI (Dublin Core Metadata Initiative) (2012年6月14日). 2019年9月20日閲覧。
- 規格
- JIS X 0701:2005「情報及びドキュメンテーション-用語」(日本産業標準調査会、経済産業省)
関連項目
編集外部リンク
編集- 特集=「統制語彙・シソーラスの現在」 - 統制語彙について日本語の文献様々
- Library Linked Data Incubator Group Final Report - 種々の統制語彙