Wikipedia:井戸端/subj/アメリカ合衆国議会関連の多数リンク切れ (Thomas)
< Wikipedia:井戸端 | subj
|
アメリカ合衆国議会関連の多数リンク切れ (Thomas)
編集※ 作業場所: Wikipedia‐ノート:井戸端/subj/アメリカ合衆国議会関連の多数リンク切れ (Thomas)
複数のプロジェクトに横断するため、井戸端に投稿しておきます。Thomasと呼ばれていた合衆国議会に関する資料を集約したサイトですが、軒並みリンク切れを起こしているようです。どなたか修正の音頭を取っていただける方はいらっしゃいませんでしょうか? 以下、私の方で把握できた情報を共有させて頂きます。残念ながら私には対応余力がないため、どなたかお願いします。
- 影響範囲 -- insource:"http://thomas.loc.gov" で検索したところ、現時点で79ページに使用されています。
- サイト廃止と移行先 -- Thomasはどうも廃止されたようで、現在はCongress.govに移行した模様。こちらの下院HPの > Learn about > Legislative Resources > Congress.gov をご参照下さい。
- 修正方法 -- ThomasとCongress.gov間でURLの共通性はなさそうので、1件1件手作業で調べなおしてリンク切れを修復しないといけないかもしれません。たとえば「デジタルミレニアム著作権法」の場合、Infobox内に「H.R. 2281」(下院で第105会期の2281番法案) とあり、http://thomas.loc.gov/cgi-bin/bdquery/z?d105:HR02281:@@@X のリンクがあるのですが、切れています。移行先のCongress.govでは https://www.congress.gov/bill/105th-congress/house-bill/2281 のURLになっています。リンク切れした79件がすべて同じ法則なのか調べてないので、Bot作業に回せるか、下調べが必要そうです。
Thomasを使用しているページには、イラン、精神障害、スペースシャトル計画、涙の道などがあり、ジャンルはバラバラです...。--ProfessorPine(会話) 2020年7月13日 (月) 07:51 (UTC)
- 情報・ 報告 Congress.govへリンクするためのテンプレートがあるのではないかと思い調べてみたところ、{{USBill}}を見つけました。外部リンクの検索結果を基にして機械的な作業を行い、Thomasへのリンクと{{USBill}}で生成した移行先のリンクの候補を一覧にしたものを作りましたので、ノートに記載します。確認印の追加、?の欄への記入等自由に編集してくださって構いません。--本日晴天(会話) 2020年7月14日 (火) 13:02 (UTC)
- コメント どうやら法案などの条文データであれば、元のURLから新しいURLにはある程度規則的な対応関係があるようなので、リンク切れしたURLからBotで必要な値を抜き出して(抜き出すための正規表現は面倒そうですが){{USBill}}に入れてやって置き換えるということは可能だと思います。しかし、それ以外のものは、議事録だの決議だのと多彩で、元のURLから新しいURLを推定することは難しそうです。とりあえず{{USBill}}を使えなかったリンク先を2つだけ探してみましたが、残念ながら元のURLとの関連はまったくなさそうなので、Congress.gov で元の文書のタイトルなどで検索し検出されたページから年や議会の回数などの一致するものをチェックする、といった作業を各記事ごとにやっていくしかなさそうです。私はこの2つを調べるだけで力尽きてしまいました(^^; --Loasa(会話) 2020年7月15日 (水) 08:02 (UTC)
- 本日晴天さん、調査一覧表ありがとうございます。見事ですね。件数をカウントしたところ、リンク本数ベースで計118件。うち規則性があって機械的に移行先リンクを生成できたのが82件 (約7割)、残り36件は手作業が必要となり、Loasaさんがうち2件を昨日調査して下さった、という状況です。
- 私の方は類似案件の「プロジェクト:日本の法令/e-Govリンク切れ対応」を対応経験しておりまして、こちらはBot修正できず手作業対応が1000件近くに上りました。e-Govのリンク差し替えは終了したものの、私の確認作業が未完のまま滞っているため、残念ながらThomasからCongress.govへのリンク移行までは手が回りません。Thomasの残り34件の手作業と、本日晴天さんが自動生成してくれた82件の確認作業、どなたか実施して頂けますと幸いです。--ProfessorPine(会話) 2020年7月15日 (水) 22:46 (UTC)
- コメント 突合せを進めました。残20件です。 --Kto2038(会話) 2020年7月22日 (水) 16:43 (UTC)
- コメント 一通り見ましたが、13件残っています。 --Kto2038(会話) 2020年7月23日 (木) 01:18 (UTC)
- コメント 見直して残11件となりました。いま残っているのは Wayback Machine に残っていません。 --Kto2038(会話) 2020年7月23日 (木) 01:27 (UTC)
- コメント それらしきものを探して載せました。残5件です。 --Kto2038(会話) 2020年7月23日 (木) 06:14 (UTC)
- コメント 見直して残11件となりました。いま残っているのは Wayback Machine に残っていません。 --Kto2038(会話) 2020年7月23日 (木) 01:27 (UTC)
- コメント 一通り見ましたが、13件残っています。 --Kto2038(会話) 2020年7月23日 (木) 01:18 (UTC)
- 追記 e-Govリンク切れの件で議論を思い出しましたが、切れているリンクの記述方法が{{Cite web}}だったり、
[[http:thomas.co.jp/○○ ほにゃらら]]
だったり。また挿入箇所も記事本文のパターンと外部リンク節やInfobox内だったりと、バラバラでした。そのため移行先リンクを調べても、Botに依頼を出すには厳しいとの判断に至りました (この議論にはBotフラグを持っているYuukin0248さんが参加され、いろいろ検討して下さったのですが)。件数も全79ページ (リンク総数118件) とそこまで多くはないので、Thomasの件もBot作業依頼を出さず、手作業修正が良さそうな気がします。
- Kto2038さん情報によると、現在残っている11件はWayback Machineで拾えないとのことなので、記事本文を読んでその文脈からCongress.govの該当ページを検索するという手法になると思います。e-Govでも同様の案件が非常に多かったです。。。--ProfessorPine(会話) 2020年7月23日 (木) 02:35 (UTC)
- コメント Kto2038さんの残件5件を捜索しました。マーク・ウェルシュの正式な昇進は議会案件ではないので、人事案通過のみであろうと思われます。--Open-box(会話) 2020年7月24日 (金) 09:19 (UTC)
- 報告 皆様ご協力ありがとうございます。ProfessorPineさんがおっしゃる通りbotで作業するには無理があるので、人手で作業を行うことを想定してノートに記載した表を作り替えて、作業済みかを記入できるようにしてみました。私の方でもほんの一部ですが作業を行っています。--本日晴天(会話) 2020年7月24日 (金) 14:40 (UTC)