|
reCAPTCHAとは、ウェブサイトの制限エリアへのアクセスを試みるボットからサイトを防御するためCAPTCHAを利用するのと同時に、そのCAPTCHAに対する返答を紙の本のデジタル化に活かすシステムである。オリジナルは2007年にカーネギーメロン大学ピッツバーグ本校にて開発された〔 Science, p. 1465 〕〔 〕。2009年9月16日にGoogleはこのテクノロジーを買い取っている〔 〕〔 〕。 現在reCAPTCHAはニューヨーク・タイムズが持つ記事アーカイブの電子化〔 〕〔 〕〔 〕及びGoogle ブックス〔の書籍電子化に利用されている〔 〕。前者は2009年の時点で、130年分を超えるという全記事のうち約20年分のデジタル化を2、3ヶ月で完了しており〔 次に挙げる、reCAPTCHA考案者のルイスが出演したテレビ番組より。米国外からアクセスしても権利制限されるため視聴できない。 〕〔 放送内容のトランスクリプト。"Transcript"をクリックすると、先述した引用がこちらから確認できる。 〕、残余は2011年末までの完了を目指していた〔 〕。 reCAPTCHAは、OCRソフトウェアが読み取れなかった文字を画像として出力し、reCAPTCHAのデータを受信する各購読サイトへ向けてそれらを割り振る。購読サイトは、書籍デジタル化プロジェクトとは概ね無関係なサイトが多いが、これらの文字を含む画像を人間に差し出して、通常通りの認証手順の一部としてCAPTCHAの文字列を解読させる。そしてreCAPTCHAサービスは解答されたデータをデジタル化プロジェクトへ送信する。 インターネット上では日々2億超のCAPTCHAが表示されているとの報告があり〔〔 〕、このリソースを活用しようと、Facebook、チケットマスター、4chan、CNN.com、及びなどの有名サイトはこのreCAPTCHAプログラムに2007年より〔 〕参加しており、Craigslistは2008年6月より参加している〔 〕。その他政府機関のウェブサイトでも使われることがあり、米国のは、2009年に完了したの際に、(Coupon-eligible converter box, CECB. いわゆるデジアナ変換機)用のクーポン申し込みサイトにてreCAPTCHAを採用していた〔 TV Converter Box Program 〕。 == 起源 == reCAPTCHAの開発計画は、マッカーサー基金のフェローシップ・プログラム(''MacArthur Fellows Program'')による支援を受けていた、グアテマラ人の計算機科学者、ルイス・フォン・アン(Luis von Ahn)が開始した経緯を持つ〔 〕。CAPTCHAの初期開発者でもある彼は、CAPTCHAを誕生させた時に、「人間の貴重なリソース、すなわち脳の思考サイクルを1回につき10秒単位で何百万時間も浪費させてしまうようなシステムをいつの間にか作ってしまった」ことに内心気付いてしまった〔 〕。そこで彼はこの無駄なリソースを有用な事業に役立てることを考えた。カーネギーメロン大学のルイスのチームは、インテルの支援を受けて、紙媒体の印字をコンピュータ可読な文字へと変換するためにウェブベースのクラウドソーシングを活用するという、このreCAPTCHAシステムを開発した。reCAPTCHAは当初、文書電子化を推進するOpen Content Alliance(OCA)の一員であるインターネット・アーカイブの代理として、書籍電子化事業に利用された〔〔 〕。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「ReCAPTCHA」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 reCAPTCHA 」があります。 スポンサード リンク
|