调教 telegram Kimi版o1实装上线，这里是咱们的一手测试

发布日期：2024-12-18 12:57 点击次数：122

调教 telegram Kimi版o1实装上线，这里是咱们的一手测试

Kimi 数学模子刚发布没几天调教 telegram，全新视觉念念考模子就来了，且发布即上线可用。

模子代号k1，据官方先容，基于强化学习，k1 原生救助端到端图像主见和念念维链技能。

因此，"解锁了包括几何图形题在内愈加全面的数学能力"。

△图片源自"月之暗面 Kimi "公众号

何况 k1 的念念考能力不单是局限于数学领域，正所谓"学好数理化，走遍寰球齐不怕"。

在官方晒出的数理化基准测试中，Kimi k1-preview 推崇全面特出 OpenAI o1、GPT-4o、Claude 3.5 Sonnect。

△图片源自"月之暗面 Kimi "公众号

此次 Kimi 新模子的发布照旧径直上线可玩的那种，APP 或是网页版找到" Kimi 视觉念念考版"即可点击使用。

既然如斯，这就飞快来实测一波～

先来一齐查验数学真题小试牛刀，这谈题目波及的学问点包括曲面积分、高斯定理等：

之前在量子位的实测中，这谈题难住了 GPT-4o。

而 Kimi 视觉念念考版经过一步步正式推理，第一次就给出了正确谜底。

它我方也示意进行了窥伺莫得乌有，"对这个谜底特地有信心"。

再来一齐还是测试过 o1 的数学概论题。

调教 telegram

Kimi 视觉念念考版也一次就作念对了：

接着是一齐高考几何真题：

濒临这谈题，Kimi 视觉念念考版解答经过并不顺畅，进行两次尝试后，照旧没能给出正确谜底√ 3/4。

此外值得一提的是，大模子当今的数学能力照旧莫得达到FrontierMath数学基准的合格线。

天然，FrontierMath 基准也确照实实是有点难为 AI 了，毕竟它出自陶哲轩在内的 60 多位顶尖数学家之手，一众顶流大模子正确率通通不到 2%。

如底下这谈素域贯串膨大问题，难度还只是基准中的"中等"。

出于酷好，咱们让 Kimi 视觉念念考版尝试了一下（万一能作念对呢）。

Kimi 视觉念念考版慢慢拆解了一通，也终究没能解答正确。

数学能力看完后，再来小试一下物理题。

底下这谈题是大学物理中的光学题：

Kimi 视觉念念考版恢复对了第一小题，但第二小题没作念对：

再来看底下这谈高考物理题：

Kimi 视觉念念考版一样只答对了一问，第二小问作念对了，第一小问答错：

不外，o1 也犯了一样的乌有，只答对了一题。

临了再来望望作念"化学题"怎么样（doge）：

性吧有你春暖花开

Candy， Happy， Bacon， Scary， Brain， House

Which is the odd one?

Hint: Chemistry

Kimi 视觉念念考版的讲明诚然有理有据：

但"门径"谜底是：

此外值得一提的是，除数理化视觉推理能力，官方还示意 Kimi 视觉念念考版在"噪声"场景，即拍摄图片婉曲、手写笔迹粗率等情况下，性能亏损幅度较小。

你合计 Kimi 新模子的推崇如何？感兴致的童鞋不妨躬行上手考考它～

— 完 —

点这里� � 顺心我，牢记标星哦～

一键三连「共享」、「点赞」和「在看」

科技前沿进展日日邂逅 ~

上一篇：色五月, 他两次参战, 第一次执俘虽败仍被前指通报嘉奖, 第二次毙俘敌44东谈主

下一篇：丝袜写真 2024年12月17日寰宇主要批发市集淡水虾价钱行情