进阶教程项目开发实测

MiniMax M3 项目开发实测：能否替代传统编程？

2026-06-02

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

MiniMaxM3作为国产开源模型，集成了Coding、百万级上下文和原生多模态能力。在真实开发测试

经常关注我动态的朋友应该清楚，过去一年我已经将 Vibe Coding 作为主力开发模式。截至目前，借助 AI 工具成功上线了 6 款产品——包括 3 个小程序和 3 个网页应用，其中部分产品累计用户已突破 9000 人。

近日 MiniMax 正式发布了 M3 模型。用一句话概括其核心突破：国产开源模型首次集齐了过去只有海外顶尖闭源模型才具备的“三件套”——Coding 能力、百万级上下文窗口与原生多模态。此前能够同时胜任这三项任务的通常只有 Opus、GPT、Gemini 等顶级闭源模型，而 M3 是国内第一款将这些能力全部带入开源生态的模型。

从官方评测数据看，MiniMax M3 的能力远不止写代码。其 Coding 能力已跻身全球第一梯队，同时在图像理解、文档解析以及 Agent 自主任务执行等方面同样表现突出。对开发者而言，这意味着 M3 不仅能生成代码，还能理解图文内容、把握业务需求，并持续推动任务闭环。

本次测试我们直接选用了 MiniMax 自家的 MiniMax Code。原因很明确：MiniMax Code 本身就是与 M3 共同训练的专属 Agent 产品，堪称目前能最大化释放 M3 潜力的官方搭档。

比起单纯测试模型本身，更值得关注的是 M3 在真实 Agent 场景下的实战表现。MiniMax Code 并非简单的代码生成器，它更像一支 AI 开发团队。面对复杂任务时，系统会自动拆解需求、规划步骤，驱动多个 Agent 协同推进。执行过程中持续检查结果、反思问题、修正方案，而非一次性生成代码就结束。

此外，它还支持超长上下文、多步推理以及原生多模态能力，既能写代码，也能理解图片、分析视频、操控电脑，甚至跨应用完成任务。近期 MiniMax Code 还引入了 Agent Team 工作流，使得多个 Agent 可以协作完成长周期、高复杂度的任务。

为了验证 M3 能否像真正的工程师那样参与实际开发，我们设计了三个真实场景进行深度测试。

Case 1：给出一段网站录屏，要求完整复刻交互效果

经常用 AI 写代码的人应该都有同感：现在让 AI 生成后台管理系统、表单页面或 CRUD 功能已经毫无难度。真正有挑战的是那些视觉惊艳的页面，比如苹果官网首页，其核心价值往往不在功能，而在于交互体验。问题在于，这类体验很难用语言准确描述。你经常陷入一种尴尬——明明知道想要什么，却不知道怎么告诉 AI。最终成品与原版差距很大。

这恰恰是当前 Vibe Coding 最大的瓶颈。很多设计与交互本身就是动态的，根本不可能通过几句 Prompt 完整描述。所以这次我们反其道而行：没有写详细 Prompt，没有拆解页面结构，也没有指定动画实现方式，而是直接录制了一段网站操作视频发给 MiniMax Code，让它利用多模态大模型理解视频效果并复刻出来。

这个测试表面考察前端能力，实则考验多模态理解力——模型必须先看懂视频，理解页面结构、交互逻辑、动画之间的关联关系，再将其转化为代码实现。该网站本质上是将滚动页面做成了动画电影的效果：每滚动一次鼠标，文字、颜色、场景都随之联动，如同掌控进度条的可交互短片。难点在于让数十个动画跟随滚动丝滑同步、不卡顿且保持高级质感。

最终生成结果令人惊喜——不仅还原了页面布局，还再现了大部分交互逻辑与动画效果。过去很多模型宣传多模态能力时，本质上只展示了静态图像识别（如识别图片中的文字或物体）。但对开发者而言，这些能力并非核心价值。真正有价值的是：能否理解动态内容？能否理解交互逻辑？能否将视频直接转化为产品？如果这一点成立，未来设计稿、录屏、竞品网站都能直接作为开发输入，极大降低普通人打造优秀产品的门槛。

Case 2：从一句话开始，让它设计并开发完整产品

过去一年通过 Vibe Coding 完成 6 个产品，最大的体会并非 AI 写代码越来越快，而是发现：产品开发最耗时的环节根本不是写代码，而是想清楚要做什么。很多人以为创业者的日常是写代码，实际上大部分时间花在需求设计上——一个产品从想法到上线，中间要经历需求分析、功能规划、页面设计、交互设计、数据库设计、接口设计以及最终开发，写代码只是最后一步。

因此这次我们故意没有给 MiniMax Code 完整需求，只给了一句话：

帮我做一个AI智能体创建平台，支持创建智能体、分享智能体，使用智能体等。做个最简单的MVP本地版，模型用MiniMax M3模型。

剩下的一切全部交给它自主完成，包括需求补全、页面设计、产品逻辑以及最终开发——目的是测试一个关键问题：它到底只是一个程序员，还是一个能参与产品设计的 Agent。

执行过程中，我们发现它并没有立即开始写代码，而是先主动分析业务目标，并就关键细节发起追问：目标用户是谁、核心功能是什么、希望解决什么问题、具体交互需求如何。补充完这些信息后，接下来的一幕令人意外——它并非像传统 AI 那样埋头干活，而是自动组建了一个“AI 研发团队”。

可以看到多个 Agent 开始并行协作：有前端工程师负责页面设计与交互实现，有后端工程师负责接口与业务逻辑，还有专门的 Agent 负责产品规划、任务拆解与代码审查。每个 Agent 承担不同职责，同步推进项目开发。这很像一家创业公司的研发团队在开会分工——需求被拆解成多个子任务后，由不同角色分别负责，再将结果汇总，而非所有事情由一个 Agent 从头做到尾。

过去的 AI 更像一个程序员，而 MiniMax Code 给人的感觉更像一个研发团队。从交付结果来看，它考虑得非常周全。无论是 AI 智能体的创建页面，还是后续的使用体验，都经过大量打磨。在创建环节，为了降低用户门槛，它提供了多个不同分类的提示词模板，即便是完全没有接触过提示词的新手，也能快速上手创建自己的智能体。在对话体验上，开场白和预设问题的设计恰到好处，能帮助用户快速进入场景，而不是面对空白对话框不知所措。

更令人意外的是细节处理：回复过程中的打字机效果、思考状态与输出状态的展示，以及历史对话记录的管理方式，都让整体体验更接近成熟产品，而非单纯给模型能力套一层界面。包括智能体列表页的展示逻辑、信息层级和交互细节，也能看出这个 AI 团队对开发者实际使用场景有较深的理解。很多地方看似不起眼，但真正做过产品的人都知道，这些细节往往比功能本身更难打磨。

一个值得注意的趋势是：未来 AI 编程的发展方向并不是让程序员写代码更快——因为代码本身迟早会变得越来越廉价。真正昂贵的是需求理解能力。谁能更准确理解用户需求，谁就更接近产品本身。所以未来最有价值的模型，不一定是代码写得最好的模型，而是最懂产品的模型。

Case 3：在老项目中集成《给阿嬷的情书》同款侨批生成器

三个案例中，这个案例最具代表性——因为它最贴近真实开发。很多人展示 AI 编程时喜欢从零起步做项目，这样最容易出效果。但现实世界的开发并非如此，绝大多数工作都发生在老项目里：修改需求、增加功能、修复 Bug、优化体验。这些才是开发者每天面对的真实场景。

所以这次没有让它重新做一个新项目，而是直接把之前上线运营的「马上表白」小程序交给它。这个小程序共有三个模块：表白、约定、贺卡。

我们提出需求：把近期热映电影《给阿嬷的情书》同款侨批生成器整合进去。看起来只是增加一个功能，实际上难度极高——它需要先理解整个项目：目录结构、现有组件、页面设计风格、业务逻辑、用户体验，然后决定新功能放在哪里、如何与现有功能融合。如果处理不当，很容易出现违和感——新功能像硬塞进去的，页面风格割裂，代码结构混乱，交互习惯改变。这也是很多 AI 在老项目场景下容易翻车的地方。

当需求提交后，它并未像大多数 AI 那样直接开始写代码，而是先对整个项目进行了一轮“摸底”。它分析了项目的整体结构，了解当前业务模块、技术栈、页面组织方式，甚至进一步阅读具体方法和函数实现，试图理解现有代码的设计思路。整个过程让人感觉它更像一个刚加入团队的新工程师——正常情况下，有经验的开发接手老项目，也不会上来就改代码，而是先花时间了解项目背景、业务逻辑和代码结构，避免因不了解上下文造成破坏性修改。

完成项目分析后，它才开始制定改造方案，并逐步实现《给阿嬷的情书》同款侨批生成器功能。

最终结果令人满意。它没有单独新增一个突兀的功能入口，而是把侨批生成器放到了原有的「表白」模块中。这个设计非常符合产品逻辑——无论是表白信还是侨批，本质上都属于情感表达与信件创作场景，用户认知成本很低。更让人惊喜的是细节处理：新功能并未采用全新的设计语言，而是主动沿用了项目原有的视觉风格与交互模式。包括页面布局、按钮样式、转场动画以及生成过程中的反馈效果，都与原来的表白功能保持一致。

整个过程给人的感觉不是“新增了一个功能”，而是像把原本就应该存在的功能补了回来。代码层面，它没有推倒重来，而是在理解现有项目的基础上进行扩展。组件复用合理，目录结构未被破坏，新增代码与原有工程自然融合。

判断一个模型 Coding 能力的标准，从来不是看它能否从零写出一个项目——因为现在大部分顶级模型都已能做到这一点。真正困难的是接手一个运行已久的项目，在不破坏现有体验的前提下持续迭代。因为这背后考验的不只是代码生成能力，而是对业务、架构、设计和上下文的理解能力。而这恰恰也是未来 Agent 最重要的价值之一。相比从零创造，理解和继承往往更难。这次 MiniMax Code 在老项目改造上的表现，确实让人看到了它在工程化场景中的潜力。

Token Plan

除了模型本身，这次令人意外的还有 MiniMax 推出的 Token Plan——主打便宜、量大、管饱。说实话，现在很多开发者使用 Agent 的最大顾虑不是模型能力，而是成本。尤其是长上下文、多轮推理、复杂 Agent 任务，一跑起来 Token 消耗非常快。

本次 MiniMax 同步推出了三档 Token Plan：

Plus：49 元/月，包含 6 亿 Token
Max：119 元/月，包含 18 亿 Token
Ultra：469 元/月，包含 55 亿 Token

如果与 Claude 同价位套餐对比，Token 用量大约能达到 15 倍左右。对于经常写代码、跑 Agent、做 Vibe Coding 的开发者来说，这一点颇具吸引力——毕竟很多时候限制我们使用 AI 的不是能力，而是成本。

最后

过去一年，通过 Vibe Coding 上线了 6 个产品。从最初连前端都不会写，到现在能够独立完成产品设计、开发与上线，最大的感受是：AI 正在快速抹平技术门槛。但随着越来越多模型都会写代码，一个新的问题也随之浮现——未来比拼的可能已经不是谁生成代码更快，而是谁更懂需求、更懂项目、更懂协作。

这次测试下来，MiniMax M3 给人的最大感受是：它开始具备了一些“工程师思维”。它能够看懂视频里的交互逻辑，能够从一句话中理解产品需求，也能够在老项目中理解上下文并完成迭代。这些能力单独看或许并不惊艳，但当它们组合在一起时，可以明显感觉到：AI 正在从一个代码生成工具，逐渐变成一个真正参与开发的伙伴。

当然，它距离完全替代工程师还有很长的路要走。但至少在 Vibe Coding 这条路上，我们已经能明显感觉到，产品开发正在从“人写代码，AI辅助”，逐渐变成“人负责想法，AI负责实现”。而这或许才是这次 MiniMax M3 最值得关注的地方。

来源：互联网

上一篇 Hermes Agent桌面端v0.5.0升级实测：界面功能全面革新 下一篇 房价估算模型对比：GWR与随机森林怎么选？

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

MiniMax M3 项目开发实测：能否替代传统编程？

摘要

Case 1：给出一段网站录屏，要求完整复刻交互效果

Case 2：从一句话开始，让它设计并开发完整产品

Case 3：在老项目中集成《给阿嬷的情书》同款侨批生成器

Token Plan

最后

相关文章推荐