AI自动生成代码，人类工程师差距21%，下一个突破何时到来?-技术教程-王剑编程网

最近有个叫OpenEvolve的AI系统在苹果芯片上自己写了代码，性能比人类工程师快21%。这事发生在5月谷歌推出AlphaEvolve之后，开发者Sharma用它优化了苹果M系列芯片的GPU任务，真实测试显示速度提升最高到106%。

这个系统不用人类教就能找到芯片的优化方法。比如苹果芯片有个叫SIMD的计算单元，AI自己发现把数据分成8个一组处理最高效，完全不用人工调整。以前人类工程师写代码时，可能根本想不到这种分组方式，或者试了很多次才找到最佳方案。

GPU核函数优化是个复杂活。要同时懂芯片架构、编程语言、算法设计和内存优化，光是这些知识就够普通人学几年。但OpenEvolve直接从基础代码开始，经过25代进化，自动发现了人类没注意到的优化点。比如它把注意力机制的计算分两步做，先算最大值再算结果，这样既稳定又快。

Sharma测试时用了20种不同场景，确保代码在各种情况下都跑得稳。系统还会自己检查有没有错误，比如内存访问问题或者计算偏差。这些测试全靠AI自己完成，人类工程师只需要设定目标就行。

现在AI不仅能写代码，还能优化代码。以前芯片公司请高手工程师调代码，现在AI可能比人更懂怎么让芯片发挥最大性能。比如苹果新出的M系列芯片有统一内存，AI直接找到了最适合它的数据处理方式，连内存布局都自动调整过了。

未来这种工具会越来越重要。芯片更新换代快，人类工程师跟不上节奏，但AI能快速适应新硬件。比如以后出个新显卡，可能直接让AI自己跑一遍优化，不用等专家研究几个月。

有人担心AI抢了程序员的工作，但其实人类还是得设定目标和验证结果。就像开车导航，人决定去哪里，AI负责找最快路线。现在AI已经能自己找芯片的「捷径」，但人还是得把控方向。

这个系统用的是谷歌的AlphaEvolve技术，开源后更多人能参与优化。开发者用Gemini系列模型组合，让AI既快速试错又能深度优化。测试时分五个小组同时进化，避免陷入局部最优解。

关键优化点包括让芯片更好用SIMD单元，以及分两步计算softmax。这些方法人类可能想不到，或者觉得没必要尝试。但AI通过大量实验，找到了最省时间的方式。

现在苹果芯片上的Transformer模型推理速度提升了，这对手机或平板运行AI应用有帮助。比如以后用手机处理复杂图像或语音，可能比现在快很多。

系统测试时用了Qwen3-0.6B模型，这种大模型本来需要高性能计算，现在AI自己优化代码后，普通设备也能跑得更快。这说明自动化编程不只是实验室成果，真能用在实际产品里。

未来可能更多领域用上这种技术。比如自动驾驶芯片、数据中心服务器，AI自己优化代码能省下大量人力和时间。但具体怎么用，还要看硬件厂商开放多少底层接口。

现在AI写代码已经不只是改改参数，而是能理解硬件特性。这种能力如果扩展到其他领域，比如医疗或交通，可能会带来更多改变。不过具体效果还要看实际应用情况。

开发者Sharma的实验证明，AI优化的代码确实比人强。但人类工程师的角色会变，从写代码转向设计系统框架。就像以前需要手写网页代码，现在用可视化工具就行，AI可能让编程门槛更低。

现在这个技术还在发展，但已经能解决真实问题。未来会不会有更多AI工具出现？现在还不好说，但至少证明了自动化编程不是空想。

王剑编程网