• 首页>
  • 学习分享——《随机性中的确定性》

学习分享——《随机性中的确定性》

仙桃大数据学院 2020-02-25 21:23 大数据,数学,天文学

2月14日下午14:00,国际顶尖数学家、天文学家夏志宏教授的《大数据分析的数学原理》系列课程第一讲:“随机并非任意,随机系统的确定性”隆重上线青青社区。

图为“青青社区”夏老师课程专区


课程正式上线前,夏老师曾说道:“本次课程比较特殊,所有论点都是我本人作为一个数学家,对大数据的独特看法和体会。我不讲具体算法,我希望能从一个更高的角度教学生。

夏老师讲课中


课程中,夏老师以如下几个案例为大家深入浅出地讲解了“随机并不代表任意,随机数据也有很强的确定性”这一道理的应用: 


第一个案例:老师让学生做连抛200次硬币的实验,并记录每一次的结果,老师拿到学生小张的结果后眉头一皱、掐指一算就发现这组数据并不是抛硬币得来的,而是他编造的。为什么呢?

案例一



通过分析小张的数据,发现数据里共有89个背面, 111个正面,出现这样结果的可能性只有1%。并且,只出现三次“连续三次出现正面”的可信度低于千分之一,一次都没出现“连续四次出现正面”的可信度低于1%。在这样几组概率数据支持下,就可以判断小张数据作假。


第二个案例:有一组论文实验数据,如下图,乍一看,这些数据好像没有什么问题。但仔细观察,你发现问题所在了吗?

案例二



在这份数据中,这40多个数字里竟然没有一个最后一位是0!并且倒数第二位没有一个是1!我们知道,实验数据有一个特点,前面几位数字因为其物理意义,不会是随机的,但末尾几位数却是很随机的。如果某位学生发表多篇论文的数据都存在这种情况,那么这些数据很大概率就是造假得来的,大家也不妨找一些论文数据来试一试!


第三个案例:当某项调查涉及到隐私时,问卷调查对象不愿如实回答,又该怎么去判断答卷的真假呢?

案例三



这也很简单,调查者可以给每个答卷者一个骰子,在回答问题前自己投骰子:如果骰子是1、2、3、4,则如实回答;如果骰子是5、6,则可以撒谎。调查者并不知道每个人的具体情况,因为答案可能是假的(保护隐私),但是整体统计数据却可以非常精确!


通过以上案例可得知,正是因为随机数据具有极强的确定性,才使得当今大数据在许多方面,尤其是打假、防欺诈等领域发挥着巨大的威力。


课程上线后,学员热情高涨。从14:00正式上线,截止当日16:00,短短两个小时内,青青社区夏老师课程学习人数达到1870人次,课程播放请求次数高达17818人次。

后台数据统计



课程尾声,夏老师结合2020新型肺炎疫情,给大家留下课程作业,鼓励学员积极思考作答,并表示将会在第二讲课程中揭晓答案。

图为本次课程作业



课程后,学员热情不减,迫不及待在学习群晒出自己思考后的习题答案,互相探讨请教,分析难点所在,学习氛围愈发浓烈。

学习群部分交流截图



同时,为鼓励学员们坚持学习、分享收获,重庆仙桃大数据学院针对本次课程学习,制定了打卡计划。学员们积极参与,纷纷将自己的学习心得与大家分享交流。


以下为部分学员的打卡内容


“第一次知道大数据如此的有趣且应用广泛,为夏老师打call。”

——赫子

“数学中随机原来有这么多学问,夏老师讲的很明白,自己受益匪浅。”

——蒲公英

“对于最后的作业,具体的误差和真实性值得我进一步思考,期待夏老师下节课为大家解惑。”

——村

……




夏老师本系列讲座共分成三大部分:


1. 随机并非任意,随机系统的确定性。
2. 确定未必可测,确定系统的随机性。
3. 数据的信息量、熵及应用。



后续课程正在紧锣密鼓的制作中,预计本周上线和大家见面。还没加入的朋友赶快扫码加入学习QQ群,获取学习资料和开课的最新消息,千万别错过与国际顶尖数学家、天文学家学习交流的机会哦!

QQ扫码或搜索群号  入群学习



温馨提示


现在扫描下方二维码,登录“青青社区”,还可免费观看夏老师第一讲课程视频,大家快冲呀!

微信扫码  直接观看



END