本読んだ。「Googleを支える技術」

Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)

Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)

 

Google検索のおおまかな仕組み、数十万台もかかえるGoogleコンピュータ群の分散処理の仕組み、電力コストの話、開発体制の話、など、グーグル社の内側の話をまとめた一冊。「情報科の大学生向けのレベル」に書かれていて込み入った複雑な言及はない、・・・はずなんだが、一読では内容をすべて理解するまでに至らんかった自分(汗。2回目読み直してようやく言ってることが半分くらいは分かったかなーという程度。検索アルゴリズムや電力コストの話なんかは比較的身近な話なので分かりやすかったが、分散処理のところはムズカシイネ。
多分アレだ、技術的なことがさっぱり分からない人が読んだら、「よくわかんないけどウチもグーグルみたいにスケールアウトできる仕組みにしておけばいいじゃん」の一言で済ませちゃうんだろうけど、何よりもタイヘンなのは、楽に低コストでスケールアウトできるような体制を構築するまでのこと。障害の発生しやすい部分や処理スピード上ボトルネックになるようなところを洗い出して1つ1つ手を打って、パフォーマンス監視のシステムを用意したり、多少の障害には自動で復旧対応できるような仕組みを導入したり。こういうヒューリスティックなしくみはケースバイケースに依存する要因が大きいので、よそでやってる仕組みは参考になる点は多数あれどそのまま別のシステム系に持っていってもうまく機能しないことが多い。
Googleは、分散処理システムを形成する1つ1つの処理について、論文という形でその内容を発表できるくらいきっちり仮説と検証を行っていて、それを膨大に積み重ねて、その結果いまグーグルがあるんだ、というのがこの本からひしひしと伝わってくる。