环球新动态：开源大模型新SOTA！支持免费商用，比LLaMA65B小但更强，基于1万亿token

首页 > 滚动 > > 内容页

环球新动态：开源大模型新SOTA！支持免费商用，比LLaMA65B小但更强，基于1万亿token

发表时间：2023-05-29 17:08:31 来源：量子位

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

【资料图】

号称“史上最强的开源大语言模型”出现了。

它叫Falcon（猎鹰），参数400亿，在1万亿高质量token上进行了训练。

最终性能超越650亿的LLaMA，以及MPT、Redpajama等现有所有开源模型。

一举登顶HuggingFace OpenLLM全球榜单：

除了以上成绩，Falcon还可以只用到GPT-3 75%的训练预算，性能就显著超越GPT-3，且推理阶段的计算也只需GPT-3的1/5。

据悉，这只半路杀出来的“猎鹰”来自阿联酋阿布扎比技术创新研究所(TII)。

有意思的是，作为一个开源模型，TII在Falcon上推出了一个相当特别的授权许可证要求：

可以商业使用，但如果用它产生的收益超过了100万美元，就要被收取10%的授权费。

一时之间，争议满满。

史上最强开源LLM

据介绍，Falcon属于自回归解码器模型。

它使用自定义工具构建，包含一个独特的数据管道，该管道从公开网络中提取训练数据。

——Falcon宣称它“特别注重数据质量”，从公网上抓取内容构建好Falcon的初始预训练数据集后，再使用CommonCrawl转储，进行大量过滤（包括删除机器生成的文本和成人内容）并消除重复数据，最终得到一个由近5万亿个token组成的庞大预训练数据集。

为了扩大Falcon的能力，该数据集随后又加进了很多精选语料，包括研究论文和社交媒体对话等内容。

除了数据把关，作者还对Falcon的架构进行了优化以提升性能，但细节没有透露，相关论文将很快发布。

据悉，Falcon一共耗费两个月，在AWS的384个GPU上训练而成。

最终，Falcon一共包含4个版本：

Falcon-40B：在1万亿token上进行训练，并使用精选语料库进行了增强；主要接受英语、德语、西班牙语、法语的训练，不会中文。Falcon-40B-Instruct：在Baize上进行了微调，使用FlashAttention和多查询对推理架构进行了优化，是一个即用型聊天模型。Falcon-7B：参数70亿，在1.5万亿token上进行了训练，作为一个原始的预训练模型，还需要用户针对大多数用例进一步微调。Falcon-RW-7B：参数70亿，在3500亿token上进行训练，该模型旨在用作“研究神器”，单独研究各种在网络数据进行训练的影响。开源许可证引争议

Falcon作为开源模型，已公开源代码和模型权重，可供研究和商业使用。

这对业界来说是一个好消息，毕竟像Meta的羊驼家族都只能用于研究目的，且还得填表格申请才行，很是麻烦。

但Falcon还是引起了争议。

这主要是因为它那“超过100万美元的任何商业应用都要收10%的授权费”的许可证要求。

据悉，该许可证部分基于Apache License 2.0协议，该协议对商业应用友好，使用者修改代码只需满足相关需求即可将新作品作为开源或商业产品发布或销售。

有不少网友认为，既然Falcon宣称开源，还要收费，就违背了Apache License Version 2.0的宗旨，不属于真正的开源。

并有人称这是一种“有损Apache软件基金会来之不易的名誉”的做法。

有网友已经跑到TII的官方账号下“讨要说法”：

你自己能解释一下这是如何符合“开源”的定义吗？

目前，官方并没有回复。

你认为这种做法究竟算不算开源呢？

x 广告

环球新动态：开源大模型新SOTA！支持免费商用，比LLaMA65B小但更强，基于1万亿token

环球新动态：开源大模型新SOTA！支持免费商用，比LLaMA65B小但更强，基于1万亿token

《合同行政监督管理办法》7月1日起施行

今日时讯：布轮特福德成赛季唯一双杀曼城球队 英超收官曼城0-1布伦特福德89分结束赛季小蜜蜂无缘欧战双杀蓝月

戚继光抗倭时日本是什么时代？戚继光抗倭发生在什么时候？

爆发！4月国产轿车销量榜：9款破万，逸动第4，帝豪、艾瑞泽5前10

真白菜价！64GB朗科存储卡跌至16.9元_每日速看

百吋巨屏市场迎来“洗牌”！海信电视E8征战618“高端局”

环球动态:《宝可梦》游戏27年累积发售4.5亿套！每17个人就有1个玩过宝可梦

2023年5月28日高效复合碱价格最新行情预测|今日热文

全球速看：安徽新增及更新公务用车原则上全部购置新能源汽车

“洋记者”探访中关村论坛展览：体验前沿科技_环球视点

《长月烬明》冥夜拯救澹台烬也是自救，般若浮生的前奏结尾别忽略

天天视点！江苏高职院校大全排名单 江苏十大公办高职院校

全球热推荐：百家讲坛易经全集在线观看（百家讲坛易经全集）

苏芮的奉献简谱_苏芮的奉献歌词？|世界最资讯

邓州：男子杀人潜逃25年终落网！ 当前热闻

宣恩县旅游业发展奖励办法（关于宣恩县旅游业发展奖励办法介绍）

【环球聚看点】女王的手术刀 有小说吗知乎_女王的手术刀 有小说吗

格鲁尔掉落_格鲁尔

对话LPL主持刘航：高压力、高竞争是电竞主持的标签

高考倒计时10天丨乘风破浪，眉山为你加油！

世界快消息！今日故园东望路漫漫双袖龙钟泪不干是什么诗

天天微资讯！牟鹏飞贡献神扑，黄政宇助攻刘彬彬破门，山东泰山1-0青岛海牛

今日快看!化疗会扩散癌细胞？这5类人，千万不要做化疗

天津鲜花预订（天津鲜花网）_环球热闻

歌手的和音是什么意思（歌手的和音是什么）|天天热闻

草木纹身贴怎么洗掉（纹身贴怎么洗掉） 全球观焦点

气温升高雨水不歇！未来一周多阵雨，体感略“乌苏”_全球快讯

环球观焦点：贵州日报拍了拍你，2023数博会特别报道请查收

学区开展“防溺水”安全教育系列 宣传活动 每日热议

武汉颜悦奶茶有限公司（关于武汉颜悦奶茶有限公司介绍）_焦点滚动

话匣君说财经：上海建设金融科技中心，干了件大事！

即时焦点：“我们的节日·四月八”暨“Hi 西秀”嘉年华系列活动开幕

当前看点!“蛙人”、登高车、多功能冲吸车齐上阵，这场防汛演练“动真格”！

鹅口疮的治疗方法妇幼医生给开的药?_鹅口疮的治疗方法

湖人不会两年6750万提前续约拉塞尔

运营商2023集体发力，今年5G手机用起来更爽了

天天快播：快穿男主开挂吗小说最新章节（快穿男主开挂吗）

齐耶赫晒与奥巴梅扬等人聚餐合照：敬许多动荡 全球看点

耳钉戴久了为什么会有味道 耳钉戴时间久了有臭味是咋回事

适格投资者注意！紫晶存储10亿赔付金设立，最快7月到账|今日热门

今热点：没想到，47 岁的吴樾还是这么能打

无影无踪什么意思_无影无踪啥意思|世界微速讯

教师工作总结2022最新完整版_教师工作总结 天天新消息

玉手镯一般多少钱一克（玉手镯一般多少钱）

全球微速讯：孔雀开屏的目的是什么_孔雀开屏的目的是

1065795155是什么电话 1065795555是什么号码

世界视讯！诺基亚N95 参数配置详解

院小能量大 田间解难题——在仙桃看“科技小院”助力乡村振兴|聚看点

世乒赛：张本智和无缘男单四强 全球微动态

茅盾白杨礼赞赏析_茅盾白杨礼赞原文

天天看点：5月26日东北地区地炼汽柴油报价暂稳

理工导航：5月26日融资买入307.84万元，融资融券余额5693.55万元|全球看热讯

世界微动态丨湖北省级党政机关和事业单位去年更新配备公车约四成为新能源车

五粮液动销旺盛，将在做好经营的同时逐年提高分红比例 | 直击股东会|每日热文

全球快看点丨推出6大特色夏游路线！湘西邀你共赴一场夏季文旅之约

焦点讯息：德惠到长春高铁时刻表_长春到德惠火车时刻表

梦幻 代练_梦幻代练吧

交警+高校+驾校，警校企共建安全文明交通

天天即时：2023年05月26日龙虎榜机构买入和卖出的个股一览

急急忙忙的拼音_急急忙忙的意思

堪称15万级“性价王”，轴距超2米7，一公里8分钱，不比CR-V香？-世界观焦点

首个！919元起！国产大飞机C919商业航班机票开售_热门

环球时讯：奋达科技(002681.SZ)控股股东及其一致行动人股份变动比例超过1%

天天短讯！通策医疗: 通策医疗股份有限公司独立董事第九届董事会第十九次会议的独立意见

刘国梁肖战太心急了！白送日本1400分，强拆2大王牌对不起林高远 世界新要闻

《华尔街日报》称韩弹药经美运往乌克兰，韩方：报道存在“不准确的部分” 天天实时

当前观点：上海月湖雕塑公园兔窝窝门票多少钱

国家邮政局：2022年快递业务量净增22.8亿件 日均业务量超过3亿件

行摄天下：荷花和应季花卉拍摄|环球讯息

香港没有战地玫瑰，只有开在地狱里的蟑螂花

怎么关闭手机上的hd_关闭手机上的hd方法

地理空间信息学科前沿发展论坛开幕|环球关注

山东农民钻研棚菜种植近30年 带领村民“突围”致富

山东农民钻研棚菜种植近30年 带领村民“突围”致富|焦点

世龙实业：公司近期未参与土地竞拍项目

明阳智能4亿元于唐山投资新设机械装备制造公司

世界文化遗产点石狮六胜塔“亮相”联合国总部

环球观察：执法人员伤人后正常上班？别一句“认错态度好”大事化了

今日时讯：布轮特福德成赛季唯一双杀曼城球队英超收官曼城0-1布伦特福德89分结束赛季小蜜蜂无缘欧战双杀蓝月

天天视点！江苏高职院校大全排名单江苏十大公办高职院校

邓州：男子杀人潜逃25年终落网！当前热闻

【环球聚看点】女王的手术刀有小说吗知乎_女王的手术刀有小说吗

草木纹身贴怎么洗掉（纹身贴怎么洗掉）全球观焦点

学区开展“防溺水”安全教育系列宣传活动每日热议

齐耶赫晒与奥巴梅扬等人聚餐合照：敬许多动荡全球看点

耳钉戴久了为什么会有味道耳钉戴时间久了有臭味是咋回事

教师工作总结2022最新完整版_教师工作总结天天新消息

院小能量大田间解难题——在仙桃看“科技小院”助力乡村振兴|聚看点

世乒赛：张本智和无缘男单四强全球微动态

梦幻代练_梦幻代练吧

刘国梁肖战太心急了！白送日本1400分，强拆2大王牌对不起林高远世界新要闻

国家邮政局：2022年快递业务量净增22.8亿件日均业务量超过3亿件

山东农民钻研棚菜种植近30年带领村民“突围”致富

山东农民钻研棚菜种植近30年带领村民“突围”致富|焦点

焦点热讯:垃圾分类宣传周|@东莞人沉浸式学习垃圾分类，“馆”够！

屏幕高清又耐用，折叠屏手机三星Galaxy Z Flip4刷新了用户认知天天通讯

全球快资讯：今日时讯：淄博少年飙车被交警抓获少年撞人逃逸被淄博市民拦下

精准全域营销 “掐准”流量平台人群精细化、场景多元化世界短讯

2021年钢结构资质怎么办_钢结构资质怎么办理天天聚看点

建筑质量评估指数分级助购房者做明智选择-全球速递

【全球播资讯】《为你逆光而来》将正式收官主创趣味陪看再现名场面

天天新动态：税惠相伴助力残疾人逐梦向前

世界今日报丨国新能源（600617）：5月25日该股突破长期盘整

让AIGC重塑家庭作业辅导，联想至像作业打印机Z1亮相焦点热文

人民币大涨_人民币持续大涨|全球快看

当前热文：“大宗商品旗手”高盛认错但继续维持看涨观点

江西夫妻共同债务律师要给多少钱全球动态

热门：今日最新更新内容小鹅花钱逾期多久上征信宽限期是多少天

2023湖北武汉青山区消防救援大队招聘政府专职消防员和消防安全检查指导中心工作人员公告（38人）世界观察

当前观察：晶科能源(688223.SH)拟于山西综改区建年产56GW垂直一体化大基地总投资约560亿元

超脑48小时下载 mp4 下载超脑48小时迅雷下载_天天观热点

蜂助手：接受广发证券等机构调研全球视讯

分娩镇痛可以让成为妈妈的过程少些痛苦吗？每日短讯

天天即时：莱万：梅西如今更像10号中场球员巴塞罗那是梅西的家

武汉一小学生校内被老师驾车碾轧致死校方：老师已被警方带走

iQOO 11S 曝光：鸡血版骁龙 8 Gen 2 + 200W 快充-世界新动态

升5G只需51元华为P50问题解决了热资讯

美国加州一图书馆发生枪击事件造成1人死亡1人受伤