文学起点网
当前位置: 首页 文学百科

机器学习计算概率(机器学习化身欧拉与高斯)

时间:2023-05-30 作者: 小编 阅读量: 1 栏目名: 文学百科

机器学习化身欧拉与高斯驭洋晓查发自凹非寺量子位出品|公众号QbitAI3.1415926……π和e这样的基本常数在科学领域中无处不在,但计算它们的高精度近似值往往令人头大如今,机器学习或许能帮上大忙能算近似值,还能在数学计。

驭洋 晓查 发自 凹非寺

量子位 出品 | 公众号 QbitAI

3.1415926……

π和e这样的基本常数在科学领域中无处不在,但计算它们的高精度近似值往往令人头大。如今,机器学习或许能帮上大忙。

能算近似值,还能在数学计算中快速找出精准规律,机器学习表示 I can I up。

这就是以色列理工学院和谷歌一起开发的拉马努金机器(Ramanujan Machine)。

拉马努金,这位英年早逝的天才数学家,总能发现一些让世人惊叹的数学公式。由他发现的圆周率π的计算公式,只需计算第一项就能突破普通计算器的最高精度。

拉马努金机器也有类似的奇效。面对各种奇怪复杂的数学常数,只要找出它的连分数表示,只需计算十几步、几毫秒就能快速收敛,得到精准答案。而且算法已经开源!

然而让拉马努金玩出花来的连分数可不是简简单单就能被找出来的,几个世纪以来,与基本常数相关的新数学公式十分少见,毕竟奠基人是欧拉、高斯这样堪称“变态”的天才,想要继承他们的事业,不仅要有丰富的知识积累,还要有敏锐的数学直觉。

而机器学习却表示,无需先验信息,我也能快速get新公式。

什么是连分数

优美的欧拉公式将e和π两个数学常数联系起来,但你知道这两个无理数是怎么算出来的吗?

你可以用泰勒展开的方法计算:

实际上还有另一种计算方法,那就是连分数,它的分母无限延伸下去,结果就会越来越接近:

黄金分割比φ=0.618……有着几乎最简单的连分数形式,一组全是1表示的数:

其他的数学尝试,包括自然对数的底e、圆周率π,还有黎曼猜想中黎曼Zeta函数ζ(3)的值。都可以用连分数来表示。

π的连分数表示

任意实数都可以用连分数来表示。

连分数有何用

你如果认为连分数是数学家们的奇技淫巧,那就大错特错了,发现连分数的某个表达式有着实际的用途。

各种数学常数的连分数是存在却不是唯一的,如果找到一个合适的连分数,那么计算结果的收敛速度会非常快,大大减少计算机的运算量。

但是找到连分数里一组特殊的数却并不是一件容易的事情,否则这套算法也不会叫做拉马努金机器了。

拉马努金发现的连分数,φ是黄金分割比

发现连分数里那些特殊整数的规律,需要有长年数学知识的积累,更要有易于常人的直觉。

现在有了拉马努金机器,可以用电脑代替人的思维去寻找特殊的连分数了。

有Reddit网友把拉马努金机器找到的公式写成Python代码,各算了一遍e和π,分别用了15步和18步的迭代,就能达到float 64的精度,也就是小数点后15位。

拉马努金机器不仅能算数学常数,如李维常数、辛钦常数,还能计算一些物理常数,如天文学计算中的拉普拉斯极限等等。

作者下一步的目标用它来做数学证明,发现数学常数的固有属性。比如e和π,我们都已经能证明他们是无理数而且是超越数,其他常数是不是无理数呢?以后或许可以用计算机来证明了。

算法介绍

论文当中提到了两种算法。

第一种是中间相遇法(The Meet-In-The Middle)。这个算法的思路非常简单:

给定一个常数c(如 c=π),根据公式:

f1(x)=x,f2(x)=1/x ,……;GCF(α,β)代表 an=α(n),bn=β(n)的连分数;α,β,γ,δ为整数多项式。

先计算出公式右边一个精度较低的值,并将其存入哈希表,然后通过枚举的方法来使公式左右两边的值相匹配,匹配上的值称为“hits”,随后增加hits的精度并重新比较,重复这个过程直到hits达到指定精度。这个最终的结果就提供了一个新的连分数。

有些hits值会产生误报,针对这一点,研究人员提出通过计算任意精度的有理函数来减少误报。

在这个算法当中,由于公式右边的计算成本更高,所以将它的值以哈希表来存储,以空间换时间。这个哈希表也可以保存下来重新服务于公式左边的枚举,从而大大减少未来的枚举时间。

MITM-RF算法不需要任何关于基本常数的先验信息,不过有许多基本常数的结构是可以推断出来的,以此作为MITM-RF的先验信息可以有效降低空间复杂度和计算复杂度。

不过,MITM-RF方法还是存在扩展性不佳的问题,于是研究者使用到了机器学习当中常用的梯度下降方法,他们称其为Descent&Repel方法

我们可以把优化问题描述成这个样子:

这里的最小值不是零维度点,而是(d-1)维的流形,其中d是给定的单一约束所预期的优化变量的数量。

研究者还观察到所有的最小值都是全局的,并且它们的误差为0,也就是说所有的梯度下降过程最后都会得到L=0的解。

这个优化问题起始于一个大的点的集合,在示例当中,所有初始条件被放置在一条线上。对每一个点迭代执行梯度下降,然后强制所有的点通过库仑排斥彼此排斥。通过梯度下降步骤保证算法朝向整数格并趋向最小曲线,最后仅返回位于整数格上的解。

网友的质疑

有Reddit网友认为,连分数通过等效变换可以获得无限多种组合这篇论文不是机器学习,它只是一种自动化查找新表达式的算法。

网友虽然反对将作者的结果称为机器学习,但它仍然是一种吸引人的算法,最有趣的是使用梯度下降优化整数分数,以前从未见过有人这么用过,因此是有创新性的。

对此,作者表示,是不是机器学习取决于你如何定义,文章中寻找新数学公式的算法是基于梯度下降的模型,因此可以看做是机器学习,今后他还将展示更直接地利用机器学习的其他结果。

至于发现新的连分数表达式,已经有前人的研究成果可供查询,而作者用拉马努金机器发现的很多结果已经被人类手工发现了。况且只要掌握了连分数的知识,就能发现各种表达式变体。

但这不正是拉马努金机器的魅力所在吗?如果你没有过人的数学头脑,就把特殊技巧交给计算机来做吧!

传送门

论文地址:

https://arxiv.org/pdf/1907.00205.pdf

源代码:

https://github.com/AnonGit90210/RamanujanMachine

连分数查询:

https://oeis.org/A003417

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

    推荐阅读
  • 云南省的气候特点(云南省的气候特点是什么)

    云南省的气候特点云南气候基本属于亚热带高原季风型,立体气候特点显著,类型众多、年温差小、日温差大、干湿季节分明、气温随地势高低垂直变化异常明显。滇西北属寒带型气候,长冬无夏,春秋较短;滇东、滇中属温带型气候,四季如春,遇雨成冬;滇南、滇西南属低热河谷区,有一部分在北回归线以南,进入热带范围,长夏无冬,一雨成秋。同日早晚较凉,中午较热,尤其是冬、春两季,日温差可达12℃~20℃。

  • 济南2022中小学教师资格面试退费申请截止什么时候?

    答:退费申请截止时间为5月20日24:00。接教育部教育考试院通知,受新冠肺炎疫情影响或因居住在有中高风险区的地区无法参加2022年5月中小学教师资格考试(面试)的考生,可申请退费。经教育部教育考试院核准退费的考生,其报名费将按原渠道全额退回,其通过的笔试科目合格成绩有效期同时自动延长半年,退费时间约为1-2个月,请务必保持原支付渠道畅通。

  • 前端javascript基础(干货前端开发中)

    前端开发中会遇到很多JS插件,在此为大家举例了一些,也是经常在项目中所应用到的,希望对大家有所帮助吧!也欢迎大家在下方热烈的留言。一.弹出层二.音频视频三.表单四.动画切版qieban(.cn)

  • 用星星纸自制手帐胶带(豆瓣日记:DIY)

    本文作者“peachbaby”,现居北京,目前已发表了65篇原创文字,至今活跃在豆瓣社区。下载豆瓣App搜索用户“peachbaby”关注Ta。这种方法做出的烫金是不会掉的哦黑色胶带、背景印章、离型纸、浮水印台、凸粉、热熔枪我试了好几种颜色的凸粉,效果都不错~各种图案的胶带、车票印章、油性速干印台、白色不干胶纸、剪刀可以尝试各种不同的花纹~我和朋友的手帐书上架啦~欢迎关注!

  • 兔肝煲粥(兔肝煲粥应该怎么做)

    我们一起去了解并探讨一下这个问题吧!兔肝煲粥兔肝煲粥是兔肝为主料制作的药膳。每次用兔肝洗净,大米适量。做法:大米洗净,浸泡30分钟。将足够量的水倒入锅中,加入大米煮沸,加入兔肝和食用油煮沸。再改小火熬煮成粥。食用时加盐调味即可。适用于肝肾虚之视力减退,肝虚头晕目眩,小儿角膜软化症等。

  • 上班族饮食应注意什么(上班族饮食应注意啥)

    上班族饮食应注意什么三餐定时研究显示,过了晚上8点之后,身体分泌的醣类物质越来越少,以至于消化系统分解食物的速度和效率也会逐渐降低。水果和纤维含量高的食物能帮助肠胃蠕动,有助于消化,可以在晚上食用。饭后适量运动饭后半小时适量运动能避免脂肪的囤积,尤其对于办公室女性来说,长时间伏案工作,腰腹部脂肪特别容易存积,所以午饭之后不能马上坐下来工作。

  • 顶流可以维持几年(怎么糊成了这样)

    继仝卓高考作弊翻车之后。2008年8月开播的《天天向上》,很快就冲进全国收视前三,被评为年度最佳节目。在周五晚七点半这个黄金时段播放,也足以证明了它在湖南台的地位。都是该话题范畴里的重量级人物,或者有着国民热度的典型代表。大量涌现的新形式节目虽然火爆,但始终没法撼动其内地综艺第一的位置。欧弟则是第二主持,负责助攻。这就是团队优先于个人的体现。例如采访机组人员的这一集,机长提醒大家坐飞机要注意保管财物。

  • 石菖蒲的功效与作用(石菖蒲的好处有哪些)

    石菖蒲的功效与作用祛痰开窍:石菖蒲可以化湿浊,它的气味芳香,也具有窍祛痰湿的功效,适用于清阳不升而引起的神识不清、耳聋目昏和精神迟钝等症状。临床上对于精神病患者有镇静和催眠的作用。

  • 早上去江边跑步好吗 早上在江边跑步好不好

    小贴士注意不要在空腹或者刚吃完饭后进行运动,容易导致肠胃不适。早上什么时候去跑步好一般是在7-9点左右较好。而一般到七点左右,太阳已经出来,植物进行了光合作用,空气质量会比较高,运动效果也会比较好。

  • 初音未来是哪个动漫的(初音未来哪首歌好听)

    初音未来是哪个动漫的初音未来并不是出自动漫,初音未来是CRYPTONFUTUREMEDIA以Yamaha的VOCALOID2语音合成引擎为基础开发贩售的虚拟女性歌手软件。由声优藤田咲提供原声。初音未来3首比较好听的歌:①《恋爱裁判》是主要由40mP制作的VOCALOID歌曲,发表在日本niconico动画网。目前已经是传说级歌曲。②《深海少女》是比较前早的歌了,也是不少人的入坑曲。③《胧月》是一首平和恬静的曲子。适合在一个月色朦胧的晚上出去散步听。歌词很美,很有诗意,旋律更是没的说。