「スケーラブルデータサイエンス」を読んだ
Aug 28, 2020 21:09 · 11 words · 1 minute read
スケーラブルデータサイエンス データエンジニアのための実践Google Cloud Platform を読んだ。GCP, Google Cloud Platform のサービスを利用したデータ分析基盤・機械学習による意思決定支援システムの作りかたを説明した本。
「顧客との会議に向かっています。飛行機が遅れそうです。離陸して連絡が取れなくなる前に会議をキャンセルする連絡をすべきか否か。という意思決定を、過去のフライトデータに基づいて決めよう」という架空のストーリーに沿って話が進む。単純な予測手法からスタートし、その欠点を理解しながら、特徴量を増やしたり、より複雑な手法を試していく。
クラウド、特にサーバーレスなサービスを使えばスケールするシステムの構築や運用のコストは小さく、ひとりでできる範囲が広がっているよ。というメッセージを感じた。