からくりインターネット

からくりインターネット

アレクサンドリア図書館から次世代ウェブ技術まで
著者名 相澤 彰子
内山 清子
池谷 瑠絵
発行元 丸善出版
発行年月日 2010年03月
判型 新書 174×112
ページ数 192ページ
ISBN 978-4-621-05379-9
Cコード 0255
NDCコード 007
ジャンル 科学一般 >  科学読み物
電気・電子・情報工学
新書 >  丸善ライブラリー

内容紹介

本書は、情報学の専門家である著者が、インターネットの情報の多くを占める「ことば」を切り口に、インターネットのしくみやからくりを解き明かす。数学やプログラムによる技術的解析とはひと味違ったアプローチで、爆発的に増加しているインターネット上の膨大な情報とのつきあい方や、その山から必要な情報を得るための検索技術、特定の文字数の文字パターンの出現率からインターネットのことばを解析する試み、コンピュータ翻訳技術の発展とその中で浮き彫りになる日本語の特徴、ウェブ(Web)上の生きた辞書「コーパス」、ネット上の「バーチャル」と現実社会の「リアル」の持つ非常に複雑な関係性、ウェブから引き出せる価値と将来の可能性や方向性など、「ことば」の専門家ならではの興味深い話題が満載。

目次

序章 世界のすべての本をアレクサンドリアに
 古代エジプトにすべての本を集めた図書館があった!
 “地中海の真珠”アレクサンドリアの誕生
 デメトリオスは王に図書館建設を進言した
 科学と文学の天才たちが逍遥(しょうよう)する「ムセイオン」
 ナイル川流域の水草から作られた古代の紙「パピルス」
 膨大な蔵書を管理するアレクサンドリアの伝統
 謎に包まれたコレクションの消滅
第一章 インターネットはことばの宇宙
 人類が生み出した情報の量はどれくらい?
 インターネットはゴミの山なのか?
 ウェブページはどこにあるのか
 銀河の星の数ほどもあるウェブページの数
 ネットの「ことば」は科学的な観測対象である
 生きたデータが行きかうウェブの多面性
第二章 情報爆発と検索のからくり
 もし検索エンジンがなかったら?
 「情報爆発」時代のリスク
 検索結果はどのように決まるのか
 巨大なデータの山に挑むグーグルの技術力
 最新データではなく「過去」を検索する
 次世代検索エンジンをウェブの行方
 インターネットの主役は誰なのか?
第三章 重要なことばは繰り返される
 「ワードサラダ」はマシンのメニュー
 テキストを解析する基本ツール「Nグラム」
 単語のバッグを開いてみると
 人のことばの使い方をモデル化する?
 情報を再生産するからくりとしてのコピー
 コピーはことばとウェブの本質である
第四章 コンピュータが翻訳すると・・・
 いかにコンピュータにことばの「意味」を教えるか
 「自然言語処理」とは何か?
 コンピュータが新しい語と遭遇する
 シソーラスと常識データベース
 「機械翻訳」は暗号から始まった!
 翻訳資源を共有し“使える”コンピュータ翻訳へ
 インターネットと日本語のゆくえ 
第五章 ネット上の別人
 ネットの中の「自分」探し
 年金問題でクローズアップされた「名寄せ」
 「名前」というものの正体
 誕生日が同じ人のいる確率
 番号で直接管理する「ID」は万能か?
 『ゲド戦記』における真の名・通り名
 意味の解像度を引き出すリンケージ
第六章 ウェブが知識をつむぎ出す
 機械が知識を生む「ウェブマイニング」という発想
 ブログから話題や兆しを見つける
 人工知能が挑戦する「中国語の部屋」
 機械が読んで学び続けるしくみを設計する
 コンピュータが人の行動から直接「読む」
 ウェブが引き起こす「知」の転換

関連商品

定価:836円
(本体760円+税10%)
在庫:品切れ・重版未定

▼ 補足資料