菜鸟游戏网 - 游戏让生活变快乐!

首页| 热搜| 排行| 话题| 热点| 标签| 小游戏| H5游戏| 软件| 最新|

手机版 |

游戏资讯: 游戏资讯; 软件资讯; 软件教程; 游戏攻略; 游戏问答

手机游戏: 角色扮演; 动作闯关; 策略战棋; 射击枪战; 休闲养成; 赛车竞速; 卡牌回合; 音乐舞蹈; 儿童教育; 体育竞技; 街机游戏; 变态手游; 即将发布; 手机赚钱

专题合集: 王蓝莓的幸福生活游戏合集; 叫我大掌柜游戏合集; 鸣沙客栈游戏合集; 熊猫餐厅游戏合集; 小说家模拟2游戏合集; 爸爸的面馆游戏合集; 异世轮回录游戏合集; 里世界危机游戏合集; 银河境界线游戏合集; 百分之一游戏合集; 可爱村物语游戏合集; 月影别墅游戏合集

热门推荐: 全民泡泡超人; 魔卡之耀; 飞羽青春; 螺旋圆舞曲2; 崩坏学园2; 代号蝶; 妙奇星球; 古代收租日记

特色专区: 我的起源; 龙珠最强之战; lol云顶之弈; 长安幻世绘; 英雄联盟手游; 龙族幻想; 跑跑卡丁车; QQ飞车

热门标签: 热门; 休闲益智; 剧情; 经营策略; 节奏; 竞速游戏; 休闲闯关; 体育; 恋爱养成; 校园; 动作闯关; 动作射击

您的位置 : 资讯 > 软件资讯 > 显著超越 SFT,o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

显著超越 SFT,o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

来源：菜鸟下载 | 更新时间：2025-03-26

上海交大、上海ai lab和港中文大学的研究人员推出visual-rft（视觉强化微调）开源项目，该项目仅需少量数据即可显著提升视觉语言大模型（l

上海交大、上海ai lab和港中文大学的研究人员推出visual-rft（视觉强化微调）开源项目，该项目仅需少量数据即可显著提升视觉语言大模型（lvlm）性能。visual-rft巧妙地将deepseek-r1的基于规则奖励的强化学习方法与openai的强化微调（rft）范式相结合，成功地将这一方法从文本领域扩展到视觉领域。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

通过为视觉细分类、目标检测等任务设计相应的规则奖励，Visual-RFT克服了DeepSeek-R1方法仅限于文本、数学推理等领域的局限性，为LVLM训练提供了新的途径。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

Visual-RFT的优势：

与传统的视觉指令微调（SFT）方法相比，Visual-RFT具有以下显著优势：

少样本学习能力: 仅需10到1000条数据即可实现有效微调。更强的泛化性: 在数据有限的场景下，性能优于SFT。

研究人员在多个视觉感知任务（检测、分类、定位等）上对Visual-RFT进行了验证，结果表明，即使在开放词汇和少样本学习的设定下，Visual-RFT也能取得显著的性能提升，轻松实现能力迁移。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

研究人员针对不同的任务设计了相应的可验证奖励：基于IoU的奖励用于检测和定位任务，基于分类正确性的奖励用于分类任务。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

在推理定位任务中，Visual-RFT展现出强大的视觉推理能力，例如，准确识别图片中运动员需要佩戴的防水眼镜。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

实验结果:

基于QWen2-VL 2B/7B模型进行的实验表明，Visual-RFT在开放目标检测、少样本检测、细粒度分类和推理定位任务上均优于SFT。即使是检测特定动漫角色（例如史莱姆），Visual-RFT也只需少量数据即可实现。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

开源信息:

Visual-RFT项目已开源，包含训练、评测代码和数据。

项目地址：https://www.php.cn/link/b2c1a4c8e4f9c3f8efe19a903a005149

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

菜鸟下载发布此文仅为传递信息，不代表菜鸟下载认同其观点或证实其描述。

展开

我的世界医院mod

类型：休闲益智运营状态：公测语言：简体中文

我的世界

前往下载

相关文章

更多>>

热门合集

更多>>

热门游戏

更多>>

作妖计

手机游戏 |

2021-01-19

下载
赤月龙城

手机游戏 |

2020-12-16

下载
大天使之剑H5

手机游戏 |

2020-09-03

下载
三国全明星

手机游戏 |

2020-12-19

下载
丛林猎人

手机游戏 |

2020-10-09

下载

热点资讯

更多>>

热门排行

更多>>

热门攻略

更多>>

热门专区

更多>>

我的起源手游下载专区-我的起源礼包激活码攻略大全

我的起源

龙珠最强之战手游攻略-龙珠最强之战下载

龙珠最强之战

lol云顶之弈手机版下载-lol云顶之弈手游攻略

lol云顶之弈

长安幻世绘官网下载专区-长安幻世绘阵容搭配攻略

长安幻世绘

LOL手游官网合作专区-英雄联盟手游攻略视频

英雄联盟手游

手机扫描此二维码,

在手机上查看此页面

关于本站下载帮助版权声明网站地图

版权投诉请发邮件到 cn486com#outlook.com (把#改成@)，我们会尽快处理

Copyright © 2019-2020 菜鸟下载(www.cn486.com).All Reserved | 备案号：湘ICP备2022003375号-1

本站资源均收集整理于互联网，其著作权归原作者所有，如有侵犯你的版权，请来信告知，我们将及时下架删除相应资源