Leseempfehlung: „Beware the Big Errors of ‘Big Data’“

Bei Wired schreibt Nassim Nicholas Taleb – erstaunlich unpöbelig und gesittet – über die Fallen von Big Data, über Signal to Noise und über die immer wahrscheinlicher werdenden scheinbaren Korrelationen.

Taleb: Beware the Big Errors of ‘Big Data’

Interessant ist seine Behauptung, dass die Zahl der scheinbaren Korrelationen überproportional mit der Datenmenge steigt. Ich  weiß zwar, dass die Zahl der möglichen Korrelationen bei $$n$$ Variablen mit $$tbinom{n}{2}$$ überproportional wächst, aber ist das der Grund für Talebs Behauptungen?

Kennt jemand statistik-theoretische Abhandlungen über das Phänomen?