大卫怎么预测彩票?
先放结果 让一让,让我来! 本人数学专业研究生毕业后做过两份职业:数据分析师和赌徒(我可能把数学专业玩坏了)。对于大数据的统计分析、机器学习、模式识别、优化算法等等都有一些研究和学习。也曾在比赛中利用机器学习模型帮助队友赢得百万大奖。 但这些都是过去式了,现在我只求安心工作,按时还贷。
所以这次我就从概率和数理统计的角度简单分析一下这个问题。 首先我们需要了解两个概念,即随机数和伪随机数(关于随机数发生器的原理我就不详细阐述了,感兴趣的同学可以自行搜索,此处只给出结论)。
1. 随机数:由已知条件无法预测其值,亦称真随机数; 2. 伪随机数:虽然看似随机实则可预测其值的数,又称模拟随机数。 因为我们已经知道“前导数”和“后导数”的关系,因此只要得到这两个数值就可以根据公式模拟出其他任意一个位置的随机数。问题变成了如何获得前导数和后导数以及它们对应的数字。
对于前导数来说,由于每期福彩中心公布的号码都是不同的(如果公布的是复选号则只需计算第一个号码即可),所以我们必须采用一种动态规划的方法计算。简单来说就是计算某一期的前导数后,将它作为下一期计算的后导数,如此反复直到最后一期。最终我们会得到一组在[1,35]范围内的随机整数。
对于后导数我们同样采取动态规划的方法计算,不过此时需要给定一个终止时间,当计算到该时间时,我们停止迭代并记录下此时的序列。因为每次迭代时后导数都覆盖了前导数,故最终得到的序列是一个倒序排列的整数组。
我们只需要获得两个未知数的初始值就可以通过动态规划法计算出整个序列。这两个未知数就是开始计算的时间点和结束计算的时间点(注意:此时间点不是指开奖时间!!!),我们分别称之为T0和T1。
为了获得上述两个未确定值我们可以做一件事情:记录连续多期的开奖数据并对各期数据进行离散化处理,得到[1,35]范围内每个位置出现次数。然后找到出现次数最多的那个时间点,以此时间为基点向后查找同时满足两个条件的所有时间点(条件是出现次数大于等于2且前后间隔小于8),记下这些点的标识,然后用最小二乘法拟合一条线性回归方程。
这样我们就得到了时间和数组的估计值,进而可以计算出所有的伪随机数。看到这里想必大家已经明白如何进行流程设计了。我们只需要保证每一步计算的数都在[1,35]范围内即可。这里需要注意一点,由于最小二乘法的引入使得我们的数据具有了不确定性,因此最后计算的随机数也不确定(服从正态分布)。但是一般情况这种不确定性的影响是可以忽略的。
以上就是我对这个问题所做的解答,希望大家满意!