样本规模
样本规模这个概念很简单:你需要一个足够大的样本才能进行有效的统计学推理。样本越小,推理就越粗糙;样本越大,推理就越准确。这方面不存在某个神奇的标准数字,样本就是越大越好,越小越糟。不到20的样本规模会导致严重的偏差;超过100的样本规模更具预测价值;达到数百的样本规模也许对大多数测试来说就够用了。有些公式和方法会明确地规定样本的必要规模,但遗憾的是,这些公式都不是为交易世界中的那些数据设计的,因为交易世界不存在精细而又规律的潜在收益分布曲线(就像图4-3中那种女性身高分布曲线一样)。
不过,真正的挑战并不在于确定样本的必要规模,而在于当你考虑某个并不是经常发挥作用的住则时,你很难评判从过去的数据中得出的推论。因为对这样的法则来说,你没办法得到足够大的样本。以大泡沫濒临破裂时的市场行为为例,你可以想出某些针对这种市场状态的法则,甚至可以检验这些法则,但你不可能收集到作出决策所需要的大样本。在这种情况下,我们必须明白我们的测试结果不具备太大的说服力,因为我们的样本比必要样本小得多。这个问题也存在于前文所说的季节性趋势的分析中。
在你测试一条新撞则时,你必须衡量一下这个撞则的应用频率。如果一条怯则在整个测试期内只有4次生效,那么从统计学上说,你无从判断这条法则是否有用,你所看到的效果很有可能只是随机性的。有个办法可以解决这个问题:你可以设法将这条法则一般化,提高它发挥作用的频率。这样一来,样本规模就会扩大,测试的统计学说服力也就相应地提高了。
有两种常见的做法可能将小样本规模的问题进一步放大:一个是单一市场最优化,一个是系统设计过于复杂。
·单一市场最优化:单独应用在各个市场中的最优化方法更难用足够大的样本进行测试,因为单个市场上的交易机会要少得多。
·过于复杂的系统:复杂的系统有很多法则,有时候很难判断某一条战则发挥作用的频率或程度。因此,如果用过于复杂的系统进行测试,我们更难对测试结果的说服力抱有信心。
出于这些原因,我不建议针对单个市场进行最优化,而且我更喜欢具备统计学意义的简单理念。
- 上一篇:样本的代表性
- 下一篇:从虚拟测试到实战交易