【Book】2017年を振り返る

今年も残り僅かですね。2017年を簡単に振り返ってみます。

Blog posts

2017年に投稿した記事数は 26 だった。 Python, R, Scala, Go について書くことが多かった。 Scala は今年から始めたけど中々良い言語だと思った。JVM上で動くプログラミング言語として初めて触った言語だった。来年も新しいプログラミング言語にチャレンジしたい。

Books read

2017年は本を 72冊 買った。読了した中で印象に残っている本を挙げてみる。

  • 恐怖の地政学 ―地図と地形でわかる戦争・紛争の構図
  • 情報アクセス評価方法論 検索エンジンの進歩のために
  • アンサンブル法による機械学習 基礎とアルゴリズム
  • 岩波データサイエンス vol.6 特集:時系列解析
  • Rではじめるデータサイエンス
  • Rプログラミング本格入門: 達人データサイエンティストへの道

『恐怖の地政学 ―地図と地形でわかる戦争・紛争の構図』

地政学は国際情勢を理解するために地理的要因に注目する学問。地形は権力争い, 戦争, 政治情勢, 社会的発展と無縁ではない。
本の中でも紹介されているように, 例えばラテンアメリカの内陸部は蚊や伝染病の巣窟でそのため沿岸部に首都が偏る傾向がある。この地域の経済成長を妨げるのは地形, ジャングルと山岳地帯である。また, ヨーロッパ全体を見ると山や川や谷があるために, 比較的狭い場所に多くの国が存在している。南アフリカはマラリアの媒介となる蚊が繁殖しにくいため, アフリカの地域では比較的経済が発展している。これらは2次元的な世界地図を眺めていても気づかないことだと思った。インターネットが普及しても, 地理的要因に縛られている部分は大きいのだと思う。

『情報アクセス評価方法論 検索エンジンの進歩のために』

本書は, 情報検索の評価指標やテストコレクションを用いた評価などについて詳しく解説している。今年の前半は仕事で推薦システムを開発したこともあり重宝した。情報推薦と情報検索には類似性があり情報検索における情報フィルタリングが一種の情報推薦とも考えることができる。 Recall や Precision, F-measure といった基本的な指標を始め, ランクの順序性を考慮した AP, nDCG, システムとしての評価指標 MAP, GMAP について勉強になった。

『アンサンブル法による機械学習 基礎とアルゴリズム』

『アンサンブル法による機械学習 基礎とアルゴリズム』の原著は Ensemble Methods, Foundations and Algorithms である。アンサンブル法は単一の学習器より精度が高くなるのが直感的にわかる気がするけど, 理論的にも理解したい人にオススメ。アンサンブル枝刈り, スタック回帰, クラスタリングアンサンブルといった応用タスクを扱っている日本語の文献はあまりないと思うのでその点も良かった。 読んだついでに Go で Random Forest を書いた。(GitHub)

『岩波データサイエンス vol.6』

9-11月にかけて状態空間モデルを勉強していて, 『岩波データサイエンス vol.6』 を参考に Python で粒子フィルタを書いた。その先の拡張はそれなりに試行錯誤が必要だったり, 実装の正しさの検証が難しかったりと新たな気づきもあった。 6巻で終わってしまい少し寂しい気分。

『Rではじめるデータサイエンス』

『Rではじめるデータサイエンス』の原著は, R界隈で有名な Hadley 氏 の R for Data Science である。データ分析のプロセス, 探索, データラングリング, プログラミング, モデリング の各段階で有用なCRANパッケージの使い方が学べる実用的な本。 dplyr, ggplot2, lubridate, stringr は以前から使っていたが再入門できて良かった。 この本を読んで forcats, purrr, modelr, bloom を積極的に使っていこうと思った。英語に抵抗がなければオンライン版 R for Data Science で充分かもしれない。Unit Test の解説も合わせて読みたい。

『Rプログラミング本格入門: 達人データサイエンティストへの道』

『Rプログラミング本格入門』の原著は Japan.R 2017 で講演を行なった Kun Ren 氏の Learning R Programming である。内容は基本的なオブジェクト, 関数型プログラミング, オブジェクト指向, ハイパフォーマンスコンピューティング等の R を使いこなす上で必要なことを分かり易く丁寧に解説している。 R言語の解説本として 14章 ウェブスクレイピングを除くと, R言語徹底解説と内容が被る部分が多いが, 読み易いのが特徴。特に 8章 Rの内部を覗く, 9章 メタプログラミング は必見だと思う。

Movies

2017年に観て印象に残っている映画。

  • 沈黙 -サイレンス-
  • 虐殺器官
  • メッセージ (あなたの人生の物語)
  • ダンケルク
  • GODZILLA 怪獣惑星
  • ブレードランナー2049
  • スター・ウォーズ/最後のジェダイ

ダンケルクはクリストファー・ノーラン監督の作品で、インセプションやインターテスラーが好きだったので観にいった。スター・ウォーズ/最後のジェダイは, 帝国の逆襲を踏襲する面もありつつも, スカイウォーカー親子の物語からの脱却を図っている印象を受けた。賛否両論でてきているけど個人的には新作が観れるだけで割と満足できる。

ちなみにアニメはけものフレンズや少女終末旅行, New Game!!, 残響のテロルを観た。