もう騙されるな!数字の裏にある罠を読み解く力
SNSで「勝率90%の手法!」「月利50%達成!」「100回中98回勝利!」といった派手な数字を見かけて、思わずクリックした経験はないだろうか。こうした魅力的な検証データに踊らされ、実際にトレードしてみると大損してしまう──。多くのトレーダーが知らない「数字の罠」がここにある。この知識がないと、どんなに優れた手法も機能不全に陥り、相場で勝ち続けることは不可能だ。
トレードの成功は、「不確実性」との向き合い方で決まる。過去の検証データで勝率90%を叩き出した手法が、なぜ通用しなくなるのか。「月利50%」という数字が、なぜ翌月には通用しなくなることがあるのか。その答えは、数字の奥に隠された「母集団」と「標本」の真実を理解しているかどうかにかかっている。
こう言うと、「うわ…数学苦手…」って人も多いと思うけど、大丈夫。毎日数字をいじくり回して計算しろという話ではなく、仕組みを知って「数字ってこういう意識で見るものなのか」という意識ができればOK。
多くのトレーダーが見過ごしがちな「信頼区間」や「シンプソンのパラドックス」といった統計学的な概念をできるだけわかりやすく噛み砕いて、トレードに応用する方法を解説する。数字の「見た目」に騙されず、その裏にある本質を見抜く力を養うことで、「勝率90%!」といった宣伝文句に惑わされることもなくなるし、自分でやった検証データを見誤ることもなくなる。
なぜ、検証データは「事実」でも信用できないのか?
トレードの検証をする際、過去の一定期間のデータを用いて、勝率や平均利益を計算することがあると思うけど、このときに忘れてはならないのが、「そのデータは、どこから取り出されたものか?」という視点。
たとえば「ユーロドルの5分足、NY時間限定、2023年1月~3月」という3か月分の勝率が90%だったとする。これはたしかに「事実」だが、では2024年の7月にそのまま通用するだろうか? ここで必要になるのが、「母集団」と「標本」という考え方だ。
母集団:自分が本当に知りたい”すべての場面”
標本:その中から一部を切り取った”観測されたデータ”
つまり、「母集団」とは、“未来の自分が実際にトレードするすべての状況”を意味している。これは、単なる「データの集合」ではなく、たとえば将来起こりうるあらゆる相場環境──為替の動き、金融政策、政治リスク、経済指標の発表、ボラティリティの大小、突発的なニュース──など、自分が関わる可能性のあるあらゆる場面の「全体像」を指す。つまり、「母集団」とは、まだ観測されていない”未来の現実”そのものというわけ。
一方、検証に使う「標本」は、その母集団から一部だけを切り取ったデータにすぎない。たとえば「ユーロドル、5分足、NY時間、3か月間」という条件で集めたデータは、ほんの一部のスライスでしかない。
それを見て「勝率90%!」と判断するのは、味噌汁の鍋の中をよくかき混ぜず、表面をひとくちだけすすって「ちょうどいい味!」と決めつけるようなもの。鍋の底には具が沈んでいるかもしれないし、まだ味噌が溶けきっていないかもしれない。これと同じように、データの一部だけを見て「この手法はすごい!」と判断するのは早計であり、本来は「この結果は、どのくらい母集団全体を代表しているのか?」を考えなければならない。
「じゃあ過去10年分、20年分だったらいいのか?」と考える人が大半だと思うが、どれだけ過去を検証したとしても、それはあくまで「標本」にすぎない。たとえデータ量が増えても、それは過去という特定の時代に偏った一部の切り取りであり、未来の相場環境を完全に代表するものではない。トレーダーが本当に向き合うべき「母集団」は、これから訪れる”未知の未来”なのだ。
「信頼区間」とは何か?──単なる確率ではないその本質
次に「信頼区間」という言葉を紹介する。これも難しい概念ではないが、多少頭が絡まる話。もしややこしいなと感じるなら、「こういう考え方があるのか」とだけ知っておくだけでも、あなたの数字の見方は全然違うものになるだろう。
たとえば、ある手法を100回試して勝率が68%だったとする。でもこれは「本当の勝率が68%だ」という証明にはならない。もしかすると、たまたま調子の良い100回だった可能性もある。
そこで、こう考える。