最近有个叫OpenEvolve的AI系统在苹果芯片上自己写了代码,性能比人类工程师快21%。这事发生在5月谷歌推出AlphaEvolve之后,开发者Sharma用它优化了苹果M系列芯片的GPU任务,真实测试显示速度提升最高到106%。
这个系统不用人类教就能找到芯片的优化方法。比如苹果芯片有个叫SIMD的计算单元,AI自己发现把数据分成8个一组处理最高效,完全不用人工调整。以前人类工程师写代码时,可能根本想不到这种分组方式,或者试了很多次才找到最佳方案。
GPU核函数优化是个复杂活。要同时懂芯片架构、编程语言、算法设计和内存优化,光是这些知识就够普通人学几年。但OpenEvolve直接从基础代码开始,经过25代进化,自动发现了人类没注意到的优化点。比如它把注意力机制的计算分两步做,先算最大值再算结果,这样既稳定又快。
Sharma测试时用了20种不同场景,确保代码在各种情况下都跑得稳。系统还会自己检查有没有错误,比如内存访问问题或者计算偏差。这些测试全靠AI自己完成,人类工程师只需要设定目标就行。
现在AI不仅能写代码,还能优化代码。以前芯片公司请高手工程师调代码,现在AI可能比人更懂怎么让芯片发挥最大性能。比如苹果新出的M系列芯片有统一内存,AI直接找到了最适合它的数据处理方式,连内存布局都自动调整过了。
未来这种工具会越来越重要。芯片更新换代快,人类工程师跟不上节奏,但AI能快速适应新硬件。比如以后出个新显卡,可能直接让AI自己跑一遍优化,不用等专家研究几个月。
有人担心AI抢了程序员的工作,但其实人类还是得设定目标和验证结果。就像开车导航,人决定去哪里,AI负责找最快路线。现在AI已经能自己找芯片的「捷径」,但人还是得把控方向。
这个系统用的是谷歌的AlphaEvolve技术,开源后更多人能参与优化。开发者用Gemini系列模型组合,让AI既快速试错又能深度优化。测试时分五个小组同时进化,避免陷入局部最优解。
关键优化点包括让芯片更好用SIMD单元,以及分两步计算softmax。这些方法人类可能想不到,或者觉得没必要尝试。但AI通过大量实验,找到了最省时间的方式。
现在苹果芯片上的Transformer模型推理速度提升了,这对手机或平板运行AI应用有帮助。比如以后用手机处理复杂图像或语音,可能比现在快很多。
系统测试时用了Qwen3-0.6B模型,这种大模型本来需要高性能计算,现在AI自己优化代码后,普通设备也能跑得更快。这说明自动化编程不只是实验室成果,真能用在实际产品里。
未来可能更多领域用上这种技术。比如自动驾驶芯片、数据中心服务器,AI自己优化代码能省下大量人力和时间。但具体怎么用,还要看硬件厂商开放多少底层接口。
现在AI写代码已经不只是改改参数,而是能理解硬件特性。这种能力如果扩展到其他领域,比如医疗或交通,可能会带来更多改变。不过具体效果还要看实际应用情况。
开发者Sharma的实验证明,AI优化的代码确实比人强。但人类工程师的角色会变,从写代码转向设计系统框架。就像以前需要手写网页代码,现在用可视化工具就行,AI可能让编程门槛更低。
现在这个技术还在发展,但已经能解决真实问题。未来会不会有更多AI工具出现?现在还不好说,但至少证明了自动化编程不是空想。