复旦大学 MOSS 大模型今日正式开源:超 100 万条对话训练数据
IT之家 4 月 21 日消息,复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。
(相关资料图)
目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。
据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
MOSS 来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的 AI 同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。
IT之家查看 MOSS 的 GitHub 页面发现,该项目所含代码采用 Apache 2.0 协议,数据采用 CC BY-NC 4.0 协议,模型权重采用 GNU AGPL 3.0 协议。如需将该项目所含模型用于商业用途或公开部署,需要签署文件并发送至 robot@fudan.edu.cn 取得授权,商用情况仅用于记录,不会收取任何费用。
MOSS 用例:
▲ 解方程
▲ 生成图片
▲ 无害性测试模型
moss-moon-003-base: MOSS-003 基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约 700B 单词,计算量约 6.67x1022 次浮点数运算。
moss-moon-003-sft: 基座模型在约 110 万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。
moss-moon-003-sft-plugin: 基座模型在约 110 万多轮对话数据和约 30 万插件增强的多轮对话数据上微调得到,在 moss-moon-003-sft 基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。
moss-moon-003: 在 moss-moon-003-sft 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。
数据moss-002-sft-data: MOSS-002 所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由 text-davinci-003 生成的约 57 万条英文对话和 59 万条中文对话。
moss-003-sft-data:moss-moon-003-sft 所使用的多轮对话数据,基于 MOSS-002 内测阶段采集的约 10 万用户输入数据和 gpt-3.5-turbo 构造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含 110 万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
moss-003-sft-plugin-data:moss-moon-003-sft-plugin 所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约 30 万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
moss-003-pm-data:moss-moon-003-pm 所使用的偏好数据,包含在约 18 万额外对话上下文数据及使用 moss-moon-003-sft 所产生的回复数据上构造得到的偏好对比数据,将在近期开源。
关键词:
-
复旦大学 MOSS 大模型今日正式开源:超 100 万条对话训练数据
2023-04-22 -
全球聚焦:河北:世界读书日 处处书香浓
2023-04-22 -
品新茶听评弹,来百年茶楼感受青浦人才懂的幸福味道
2023-04-22 -
底纹背景怎么调节_底纹背景
2023-04-22 -
《青春环游记4》游魅力台州临海,探千年古城_微头条
2023-04-22 -
物业管理为何乱象频频?听听网友怎么说......
2023-04-22 -
广东省新丰县发布雷雨大风黄色预警 今日播报
2023-04-22 -
中国依然是全球投资热土!在华外企以实际行动投下信心票_简讯
2023-04-22 -
今日报丨一季度四川地区生产总值达13374.7亿元 经济延续恢复发展态势
2023-04-22 -
焦点速看:引领皮卡4.0时代 长城2023款乘用炮/山海炮PHEV/HEV亮相-每日看点 热门
2023-04-22 -
【世界聚看点】帕金森病的三级预防是怎样的呢
2023-04-22 -
【开发者日志】新的历程新的成长-简讯
2023-04-22 -
世界热文:广发银行“女大老虎”王桂芝:退休两年半被捕,以为“平稳着陆”
2023-04-22 -
斗罗大陆:深海魔鲸王并未陨落,修罗神为让唐三继承神位盯上小舞
2023-04-22 -
天天快报!个体工商户要交哪些税 税率是多少 个体工商户要交哪些税
2023-04-22 -
安徽高价值发明专利突破4万件
2023-04-22 -
慢性甲状腺炎症状_慢性胆囊炎吃什么药最好
2023-04-22 -
怎么合成照片手机_怎么合成照片
2023-04-22 -
聚焦:东华软件全资子公司中标5.14亿元人工智能计算中心项目
2023-04-22 -
要闻速递:思特威:4月21日融资买入1034.87万元,融资融券余额7334.96万元
2023-04-22 -
松茸吃法及注意事项_松茸怎么吃
2023-04-22 -
关注:火灾背后的长峰医院:已连锁近20家 设想覆盖全国
2023-04-22 -
京东健康的价值与风险,看明白的人还不多-世界消息
2023-04-22 -
冰川网络收关注函,被追问盈利1.29亿元却分红超3亿元,是否通过高比例分红现金向主要股东利益输送
2023-04-22 -
生益科技:4月21日融资买入4254.61万元,融资融券余额6.47亿元-新要闻
2023-04-22 -
智学网成绩查询入口(智学网官方登录查分网站)_焦点讯息
2023-04-22 -
全球热议:慎防落入低价旅游陷阱!“五一”小长假济南带来五个“提醒”
2023-04-22 -
再见拜仁!7000万或投曼城,1.5亿攻击手有望加盟
2023-04-22 -
本地找工作60岁保安_本地找工作-环球聚焦
2023-04-22 -
每日快讯!北京未来30天天气预报 视频_北京未来30天天气预报
2023-04-22
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16