GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线
已多次力荐
丰色 发自 凹非寺
量子位 | 公众号 QbitAI
陶哲轩有多爱GPT-4?
这回,不止写论文做研究,学新工具时他也离不开它了。
就在今天,他的又一篇成果上线,关于麦克劳林不等式。
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/1436c2d261f558767c0abd2e5bcc9060.png)
为了更好地展现其成果,48岁的他开始学习Lean4(一种可作为交互式定理证明工具的函数式编程语言)。
他自述,随着学习该语言“关卡难度”的增加,GPT-4又能帮大忙了——
如果没有它帮我解决各种微妙的语法问题,你都无法想象我有多崩溃。
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/460436d4ce70971d6884f8b2d28623a4.png)
不愧是GPT-4的“野生代言人”。
至于这次的论文,陶哲轩表示:
非常简短,只有11页。并且用到的方法非常基础,只需要本科的微积分和多项式知识就可以。
一起来看看[狗头]
麦克劳林不等式
这篇论文10月10日发表,距离上一篇“欧拉函数的单调非递减序列”差不多正好一个月。
总的来说,这篇论文主要讲的是经典麦克劳林不等式认为初等对称为以下形式(公式1):
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/f6c24477eb9d8daca9a186cd78ba9b0c.jpeg)
当1≤k≤ℓ≤n且y=(y1,…,yn)由非负实数组成时,它服从不等式(公式2):
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/1d5ab6c1c57f3d3b5c2c20cc06600f30.png)
在此,陶哲轩提出了一个变体(公式3):
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/2eaa34951bc5090a57809000a12698f4.png)
在这个变体中,yi被允许为负。
在这种情况下,不等式“急剧上升”为常数,即使分母不含k1/2因子不等式也是已知的。
具体而言,陶哲轩写道:
公式2也可以被用牛顿不等式来证明:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/72a65411938e045c46051f99bf116610.png)
所有1≤k<n和任意实数y1,…,yn有效(特别是这里的yi被允许为负数。</n和任意实数y1,…,yn有效(特别是这里的y
但是请注意,当k=1,n=2时,它就是算术平均-几何平均不等式了:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/6d1fa00725e9ec19e00b1262c357e0d1.png)
这种不等式的一般情况可以通过许多标准操作从上面这种特殊情况中推导出来。
为什么可以?这主要归功于罗尔定理(Rolle’s theorem)。
但陶哲轩指出,关键点是是该运算保留了直到Sn-1为止的所有基本对称均值。
接下来,我们可以将麦克劳林不等式视为提供n变量上的算术平均-几何平均不等式的改进版本(当k=1,ℓ=n时)。
不过,牛顿不等式适用于任意实数yi ,一旦允许一个或多个yi为负,麦克劳林不等式就会“崩溃”。
但鉴于当n为偶数时会出现一个关键示例:yi的一半等于+1,一半等于-1。
我们就可以验证基本对称均值sk中当k奇数时“消失”,为偶数时则等于:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/e6753a55ab69b9760921188e02542dbf.jpeg)
特别地,一些常规估计可以得出量级界限(公式a):
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/3386225931abed6390940e471c0c261f.jpeg)
问题又来了,由于当0<k≤n上式也成立,因此即使在sk(y)上加上绝对值之后仍然严重违反了麦克劳林不等式。</k≤n上式也成立,因此即使在s
另一方面,其他数学家还观察到,如果两个连续值都很小,这会导致所有后续值sℓ(y)也很小。
还有另一数学家观察到了这一说法的更精确版本(公式b):
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/15b2cab00a5a98b21c1771821df16f2b.png)
其中1≤k≤ℓ≤n且y=(y1,…,yn)为实数(但可能为负)。
假设k=1,ℓ=n,我们就能得到不等式:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/e4c951f4038a2c9c8641d5cb57c4dd3f.png)
再结合算术平均数-几何平均数不等式又可以成立不等式:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/e8bec154893e581eaafab6e235e86ea2.png)
以及等式:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/ef8ff86d925db96745da584660add663.png)
与牛顿不等式的证明一样,公式b的一般情况可以通过一些标准操作(包括前面提到的微分运算)从这个特殊情况得到。
然而,如果对照关键示例给出的边界a (公式a) 检查边界n (公式b),我们会发现不匹配:
在k1/2的影响下,b的右侧比左侧大。
在此,论文的主要成果就是通过建立最佳修改(直至常数),即前面提到的公式3来纠正这一问题。
这个成果也回答了数学网站MathOverflow上网友提出的疑问:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/f43f3c8eb164aa3d29758378aebf2205.png)
那么陶哲轩是如何解决的呢?
与前面的论点不同,他在这里不主要依赖算术平均数-几何平均数不等式。相反,主要工具是新的不等式:
![GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线](/wp-content/uploads/replace/dae83ecca47ecda44216413a81d853fe.png)
它对所有1≤ℓ≤n和r>0有效。
该式子的证明大家如果感兴趣可以进一步查阅博客或论文,主要涉及一些微积分、二项式定理和多项式的知识。
论文地址:
https://arxiv.org/abs/2310.05328
参考链接:
https://terrytao.wordpress.com/2023/10/10/a-maclaurin-type-inequality/(博客)
https://mathstodon.xyz/@tao
- 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计2024-04-09
- 刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了2024-04-10
- 8.3K Stars!《多模态大语言模型综述》重大升级2024-04-10
- 谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用2024-04-10