「道具としてのベイズ統計」涌井良幸

オススメ度 ★★★★☆ 4/5
ベイズ統計についてわかりやすく説明している。

本書でベイズ統計については3冊目である。概念的なところから入り少しずつ細かいことまで理解したいと考え、数式などを極力省略しないで実践的に説明している書籍をと思い本書にたどりついた。

これまでによんだベイズ統計の本のなかでもっともわかりやすかった。ベイズの定理の事前確立や事後確立を、事前分布、事後分布と確立分布という分布という考え方にも適用し、確立の総和が1であることを利用して、単純でかつ汎用性が高い考え方になることをわかりやすく説明している。

また、自然な共益分布を用いることによって計算が簡単になり、事象によって適した共益分布があるということも理解できた。二項分布ならベータ分布が適しているのということである。

一方で、分散が未知の場合の考え方あたりから、着いていくのが難しくなった。この辺はまたモチベーションの高い時にさらに繰り返し読んでしっかり身に付けたいと思った。以降は様々な手法についてExcelによる実際の実行方法なども含めて触れている。

理系の人間には問題ないだろうが、若干省略されていると感じる部分もあった。とはいえベイズ統計についてわかりやすくまとまっていて、初めて不足なくベイズ統計について知りたい人には最適と言えるだろう。

【楽天ブックス】「道具としてのベイズ統計」

「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」涌井貞美

オススメ度 ★★★★☆ 4/5
ベイズ統計についてわかりやすく解説する。

昨今ベイズ統計について触れる機会があり、ベイズ統計の本を読み漁っている。本書もそんななかで出会った。

本書では、トランプや天気予報を例に、乗法定理、加法定理、ベイズの定理を説明している。大まかなベイズ統計の考え方は理解できる。ベイズ更新よって、常にデータを更新できる点が実践的であるという印象を受けた。感覚的に受け入れるのが難しいのが「理由不十分の原則」であるが、ここにかんしてはそういうものとして受け入れるしかないのだろう。

また、ベイズとかベイジアンという言葉をよく見るが、ベイズ確率論やベイズ統計論などベイズという言葉を使った学問も多岐に渡ることを知った。

今まで読んだベイズ統計の本のなかでもっともわかりやすかった。とはいえ手順を手取り足とり示してもらってようやく付いて行ける程度で、まだ、理解が漠然としているので、引き続き繰り返して理解を深めたいと思った。

【楽天ブックス】「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」

「ベイズ推定入門」大関真之

オススメ度 ★★☆☆☆ 2/5
ベイズ推定について初心者にもわかりやすく説明している。

仕事で使用するABテストでベイズ推定の考え方が用いられていることを知り、よく聞くベイズ推定を深く知りたいと思ってその一歩目として本書にたどりついた。

かなり簡単に書かれているとは言え、簡単に書くために必要以上に省略していると思われる部分が多く、逆にわかりにくく感じた。また、本書は別冊の「機械学習入門」の続編と位置付けられているようで、あくまでも機械学習のためのベイズ推定という内容で、一般的なベイズ推定の範囲とは少し異なるようにも感じた。

とりあえず、本書で出会った最尤推定、最尤法などの詳細な方法、事前分布から事後確率分布の更新方法などはもう少ししっかりと理解したいと感じた。

【楽天ブックス】「ベイズ推定入門」

「A/B Testing:The Most Powerful Way to Turn Clicks Into Customers」Pete Koomen, Dan Siroker

オススメ度 ★★★★☆ 4/5
ABテストプラットフォームの先駆者であるOptimizelyのCEOである著者が、そのサービスやクライアントを通じて得られたABテストの知見を語る。

最近我が社でもまたABテスト熱が再燃しており、同僚がとっているその流れに不安を覚え、少しでも組織として意味のあるABテストができるようにと思い本書にたどり着いた。

ABテストを専門的に取り上げた書籍を読むのは本書で3冊目になるが、ABテストのプラットフォーマーとしての視点で書かれたものに触れたのは本書が初めてである。 序盤はオバマ大統領の大統領選におけるABテストの貢献の大きさなど、さまざまな形のABテストによる改善例を示している。

そんななか本書ではABテストの流れを次の5つのステップとしている。

1.Define Success
2.Identify bottlenecks
3.Construct a hypothesis
4.Prioritize
5.Test

1の成功の定義は必ず言われることで(とはいえ抜けがち)特に新しくはないが、2のIdentify bottlenecksという考え方は他のABテスト関連の書籍にはなかったので新鮮に感じた。向上などの生産効率を上げるためにはボトルネックという考え方は一般的だが、より良いサイト制作においても、目的のコンバージョンに対して、トラフィックがどこで止まっているのか、そんなボトルネックにもっと意識を向けるべきなのだろう。

またMicroconversionとMacroconversionというように、コンバージョンを二つに分けて考えている点も興味深い。3のConstruct a hypothesisでは、単純に思う仮説ではなく、ユザーインタビューやご意見フォーム、フォーカスグループなどを通じてより精度の高い仮説を挙げることを推奨している。この辺はかけられる工数によって実践していきたいと思った。

中盤以降では、実際に組織にABテストの文化を組織に浸透させる方法について、外部のサービスを利用する方法や新たにエンジニアを雇って組織内にテストチームを作る方法など、それぞれのメリットやデメリットを書いている。

全体のなかで特に印象的だったのは次の言葉。

A question worth asking about every test is, “Would you be happy showing the winning variation to all of your traffic”
「勝ったテストパターンをすべてのユーザーに喜んで見せられますか?」と尋ねてみるべきです。

つまり、結果が良かったテストパターンが必ずしも正解というわけではなく、例えばユーザーがクリックするボタンが絶対的に正しければ、世の中のボタンはすべて女性の裸になってしまうということである。組織として、ブランドとして、そのテストパターンを世の中に自信をもって出せるのか。それを考えずに思いつくままテストをしてしまうと、ただ時間や労力の無駄になりかねないのである。

また次の冗談も、いきすぎたABテスト主義を抑制するために使えることだろう。

There’s a joke among A/B testing veterans that almost any variation of a button loses to a button that says “Free Beer.” ABテスト業界にはこんな冗談があります。どんなボタンバリエーションも「無料ビール」というボタンには叶わないと。

ABテストの方法にさらなる理解を与えてくれる内容である。本書の上の言葉に出会って、早速醜い見た目、誤解を招きかねないABテストパターンを実践している自社のABテストを改善したくなった。

「A/BTesting:Practical Insights and Common Pitfalls」Divakar Gupta

オススメ度 ★★★☆☆ 3/5
ABテストの手法、ツールについて語っている。

序盤は簡単なABテストの説明をしており、中盤からはABテストで起こりがちな落とし穴、またABテストのためのツールなどを紹介している。大部分はABテストの15の落とし穴にページを割いており、いくつか興味深いものがあった。いつでも言及できるように覚えておきたい。

Running an A/B test without thinking about statistical confidence is worse than not running a test at all — it gives you false confidence that you know what works for your site when the truth is that you don’t know any better than if you hadn’t run the test

平均値のみを気にする


例えば新しいUIをリリースして、次の一週間のアクセス数が大きく伸びたとしても、日別に伸びているかを確認すべき。一日だけ極端に伸びた結果全体の数値を上げているのだとしたらそれは別の要因によるものだからだ。

「なぜ」を知ろうとしない

例えばABテストが失敗した場合、機能が良いものであるにも関わらず、デザインがよくなかったり説明が悪かったりする。単純に失敗した、だけでなく、「なぜ」失敗したかを知ることは、さらなる成功へ近づくのである。

正直、あまり順序立てた書き方をしておらず、よくあるABテストの落とし穴を思いつくまま羅列しているような内容なので退屈で頭に入りにくいが、もう一度じっくり読み直してみたいと感じた

「Designing with Data」Rochelle King/Elizabeth F Churchill/Caitlin Tan

オススメ度 ★★★★☆ 4/5
Spotify、Netflixなどなど、IT業界の著名な企業が、ABテストなどの調査を利用してサービスのデザインを発展させる方法について書いている。

本書ではDataを利用した開発手法を3つに分類している。

Data Aware
Data Informed
Data Driven

Data Drivenは取得したデータを信用してデザインを行うのに対して、Data Awareは参考程度に利用するといった意味である。いずれの方法も取得したデータを利用するが、そのデータの重要視具合が異なるのである。僕自身Data Driven Designという言葉を、「データに忠実にデザインする」という意味に受け取っていたが、かならずしもそうとは限らないのである。

さてABテストの利便性はわかっても、数あるテストしたい項目は、コンテンツやサービスの方向性などの大きな項目から、ボタンの色や文言などの細かい項目まで多岐にわたる。本書では第3章からそんな大量の知りたい項目を体系立てて行っていく手法について説明している。覚えておきたいのは、目的からテストまでを5階層にわけた考え方。

Goal
Problem/Opportunity Area
Hypothesis
Test
Result

そして、探索と評価、グローバルとローカルの2つの軸にテストの内容をプロットする考え方である。

Exploration-Evaluation
Local-Global

デザイナーのなかには、直感やセンスなど経験で培っていた部分を大切にしていて、データによってデザインするという考え方に抵抗を持つ人も多いだろう。しかし、本書で描かれている手法は、まったくそんなデザイナーの創造性を否定しているわけではない。むしろ、データという実際のユーザーの反応にしっかりと目を向けることで、デザイナーの持つ経験や創造性をさらに効果的に発揮させることができると言っている。

なかなか一度読んだだけで実践するのは難しいだろう。今後実践のなかで何度でも読み返したい。