好吧。我只是说说,还没做完。我昨天下载了一个从2003年开始到12年的双色球历史数据。我设计了一个模型。很简单:
将每周的开奖号码作为一组数据,以周一开头,周日结尾。
然后前3个红号为一个区间,后3个红号为一个区间,蓝号专门为一个区间。
之后每个区间取最少出现的6个号码,蓝号也一样。
之所以取6个,是因为第一区与第二区出现的数据可能会有重合,换句话说就是从12个候选号中选取6个。目前为止还没发现12取6还不够的情况。
其实仔细看,双色球的数据并不多。所以我的粒度没有分的太细,本来想玩3d的。后来发现就算我把粒度放到了每一位统计的情况下,最少见的数字出现频率依然很高。感觉没啥意思。
将每周的开奖号码作为一组数据,以周一开头,周日结尾。
然后前3个红号为一个区间,后3个红号为一个区间,蓝号专门为一个区间。
之后每个区间取最少出现的6个号码,蓝号也一样。
之所以取6个,是因为第一区与第二区出现的数据可能会有重合,换句话说就是从12个候选号中选取6个。目前为止还没发现12取6还不够的情况。
其实仔细看,双色球的数据并不多。所以我的粒度没有分的太细,本来想玩3d的。后来发现就算我把粒度放到了每一位统计的情况下,最少见的数字出现频率依然很高。感觉没啥意思。