AI“源神”启动！影响多大？

开源还是闭源？这是属于大模(mó)型的时代之问。

今年年初，埃隆·马斯克在对OpenAI及其CEO萨姆 ·奥特曼提起诉讼时，就对OpenAI逐渐(jiàn)不公开其模型研究相关细节的行为大加谴责。“时至今(jīn)日，OpenAI公司网(wǎng)站还宣称，它(tā)的宗旨(zhǐ)是确保通用人工智能(néng)造福全人类。然(rán)而，在现实中，OpenAI已经转变为科技巨(jù)头(tóu)微(wēi)软事实上的闭源子(zi)公司。”这位曾经的OpenAI联合创始(shǐ)人如此(cǐ)表示。

OpenAI不够“Open”，Meta却“Open”了自己最新的开源人工智能模型。

4月18日，Meta 发布了其最新版(bǎn)本的开源大模型 Llama 3，引起开源AI社区的一阵欢呼。巧合的是，Llama 3发布当(dāng)天(tiān)正好是AI领域顶尖学者、AI开源倡导者吴恩达的生日。“（Llama 3是(shì)）至今为止最好的礼物，谢感谢Meta！”他说。

行至2024，开(kāi)闭源之争日渐白热化。闭(bì)源阵(zhèn)营以目(mù)前最强的OpenAI为代表，开源阵营Meta的LLaMa、Mistral和(hé)Google等也在不断迭(dié)代。闭源阵(zhèn)营坚(jiān)持对Scaling Law的(de)信仰，押注在更强通用模型(xíng)的打造上；开源阵营模型能(néng)力不断(duàn)提升，并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地。

关于应该选择(zé)模型开源还是闭源讨论经久不(bù)息。

对于局内人，这一选(xuǎn)择这不仅决定了他们将如何点(diǎn)亮(liàng)AI“科技树”，更将(jiāng)影响他们的商业路线选择。换言(yán)之，这(zhè)很有可能(néng)是这(zhè)个残酷竞争市场下(xià)的生存问题(tí)。

两个版本，多(duō)重惊喜

Meta此次(cì)发(fā)布的(de)Llame 3包括8B和70B的预训练和指令微调版本(běn)。

据Meta官网信息，Llama 3 模型(xíng)将数据和规模提升到新的高度。它在两个定制24K GPU集(jí)群上(shàng)基于超过 15T 的数据进行了训练(liàn)——训练数据集是Llame 2使用量的7倍有余。它支持 8K 上下文长度，是 Llama 2 容量的两倍(bèi)。

除了 Llama 3，Meta 还发(fā)布(bù)了新的信任和安全工具，包括(kuò)Llama Guard 2、Code Shield和 CyberSec Eval 2。

据(jù)悉(xī)，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主(zhǔ)要云提供商、模型 API 提供商平(píng)台上线，Llama还得到AMD、AWS、戴尔、英特(tè)尔、NVIDIA和高通(tōng)提供的(de)硬件平台(tái)的支持。

在官网上，Meta还放出了Llama3两个(gè)版本与谷(gǔ)歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争(zhēng)对手的(de)参(cān)数对比。据Meta官网，Llame3在MMLU（学科知(zhī)识理(lǐ)解）、GPQA（一般问题）、HumanEval（代码能力）、GSM—8K（数(shù)学(xué)能力(lì)）、MATH（比(bǐ)较难的数学问题）5个评测集上均表现良好。

值得注意(yì)的是，Llama3的代(dài)码能(néng)力非常优秀。在AI领域公众号“数字生(shēng)命卡兹克”主理人卡兹克分享的用户实(shí)测中，Llama3—8B能够(gòu)给(gěi)出国际象棋中经(jīng)典皇后问题的解题代(dài)码。而其前代版本Llama2需(xū)要(yào)专门的代码模型才能(néng)实现。

市场的反应速度很快。18日当(dāng)天，Meta股价逆势收涨1.54%。次(cì)日，百度智能云(yún)千帆(fān)大模型平台开放邀约测试，提供针对Llama 3的训练(liàn)推理方案，帮助开发者训练专属(shǔ)大模型。

8B和70B 两个(gè)型号的模型(xíng)，仅仅标志(zhì)着 Llama 3 系列的(de)开端，Meta AI首席科学家杨立昆在其社交媒(méi)体透露，在接下来的几个月，还会有更多版本(běn)陆续发布。

英伟达高级科学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版(bǎn)本将(jiāng)成(chéng)为某种“分水岭(lǐng)”，开源社区将能用上GPT-4级别的模型。

不下牌桌，各显神通

上一轮元宇(yǔ)宙竞争(zhēng)中被认为可能跌进坑里的(de)Meta，在人工智(zhì)能的牌桌上打出了Llama系(xì)列这把好牌。要讨论Llama3带(dài)来的行业震(zhèn)荡，首先要明白，什么是(shì)大模(mó)型领域的开(kāi)源(yuán)？

大模型领(lǐng)域的开源(yuán)通常意味着模型的架构、训(xùn)练代码和预训(xùn)练(liàn)权重(zhòng)等都(dōu)被公开(kāi)，允许研究(jiū)人员和开发者(zhě)自由地访问和(hé)使用。

不过，开(kāi)源的程度因模型而异。“有些可能只提供有限的访(fǎng)问权限(xiàn)或部分代码。”郭涛指出，判断大模型是否真正开(kāi)源的基准可能包括：代码和数(shù)据的可访问性、使用许可的宽(kuān)松(sōng)程度、社区支持的活跃度以及对改进和新应用的开放性(xìng)。

放眼AI界，两条路径上都各(gè)有(yǒu)“头号玩(wán)家”分布。闭源(yuán)自不必说，海外有OpenAI旗下的ChatGPT，国(guó)内是百度的文心一言以及风(fēng)头正劲的月之暗面Kimi。

而开源(yuán)方面，除(chú)了Llama系列，目前应用较广的开源大模型还包括非营利组织LAION推(tuī)出的OpenFlamingo、Databricks的Dolly，以及MosaicML的(de)MPT等(děng)。国内则包括，阿里(lǐ)巴(bā)巴的通义千问，智谱的ChatGLM-4、百川(chuān)智能的baichuan-7B中英文大模型(xíng)、北(běi)京智源(yuán)悟道(dào)3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样的分化，很多时候是受技术进步和(hé)商业模式迭代等的多重(zhòng)影响。

天(tiān)使投资人(rén)、资深人工(gōng)智(zhì)能专家郭涛认为，从技术角度来看，开(kāi)源可以促进学(xué)术界的研(yán)究和创新，而闭源则有助于在一定时(shí)间内保持技术领先优势。

从商业角度来看，开源可(kě)以吸引开发(fā)者社区(qū)的贡献，促(cù)进技术的快速迭代和应用的(de)广泛传播，但可能会影(yǐng)响到公司的盈利模式(shì)今日42只A股跌停有色金属行业跌幅最大。闭源则可以保(bǎo)护知(zhī)识产权，为公(gōng)司创造直接的收入来(lái)源，但可(kě)能会限制技术的普(pǔ)及和生态的建设。

事实上，在Llama3发布之前，中文互联网刚刚经历了一轮开(kāi)闭源论战。

据媒(méi)体报道(dào)，百度(dù)CEO李(lǐ)彦宏近日(rì)表态，认为大模(mó今日42只A股跌停有色金属行业跌幅最大)型开源意义不大，闭源模型性能会不断提(tí)升。“有了(le)文心大模型4.0，我们可(kě)以根据(jù)需要兼顾效果、响应速(sù)度(dù)、推理成本等各种考虑，裁剪出适合各种场景的(de)更小(xiǎo)尺寸模型，且支(zhī)持精调和post pretrain。通过(guò)降维裁剪出的模型，比直(zhí)接拿开源调出来的模型，同等尺(chǐ)寸下效(xiào)果更好，同(tóng)等效果下成本明显更低(dī)。”

李彦宏一直是(shì)闭源路线的忠实拥趸，理(lǐ)由包括(kuò)但不限于认可闭源商业模式可以更(gèng)好(hǎo)地聚集人力和财力(lì)等。

而其反对者——360创始(shǐ)人周(zhōu)鸿祎言(yán)简意赅(gāi)，“一句话，今天没有开源就没有 Linux，没有(yǒu) Linux 就没有互联网。”

“源神(shén)”启(qǐ)动(dòng)，影响(xiǎng)几何？

“Llama 3的发布会带(dài)来市场格局的改变。”郭涛在接受21记(jì)者(zhě)采(cǎi)访时指出，其优异表现(xiàn)可能吸引更多的用户和投资者，从而(ér)增加其市场份额(é)。

官网显示(shì)，Llama 3将有条件地开源给商业使(shǐ)用（月活用户超过(guò)7亿需要(yào)单(dān)独申请）。“不过这基(jī)本(běn)等于完全(quán)免费商用了。”卡兹克表示。

此前，投资(zī)人朱啸虎曾经就人工智能市场相关(guān)话题接受腾讯(xùn)新闻采访。当(dāng)被问及2023年大模型(xíng)发展的关键(jiàn)节点时，他(tā)给出的回(huí)答正是(shì)Llama上线。这让中(zhōng)国在应用层面创新有了基础，降低了商业化(huà)门槛。

当然，朱(zhū)啸虎提到的变现是指开源生态内的用户(hù)。对于开源大模型发布者的能否盈(yíng)利(lì)，或者(zhě)能等来盈(yíng)利机会，很多时候(hòu)并没(méi)有确(què)定的答案。

闭源大模(mó)型通常通过授权使用、订阅服(fú)务或者直接销售产品(pǐn)来盈利(lì)。其中的代表(biǎo)便是AI领域(yù)的领(lǐng)跑者OpenAI，虽然其一直有推进开源项目(mù)的动作，但其处在核心地位的ChatGPT却一直采取收取API许可(kě)费的(de)方式向其他公司提供(gōng)服务。在API服务过程，其(qí)他公司不会接触到ChatGPT模型的细节和源代(dài)码，仅仅通过API接口(kǒu)进行调用。

创(chuàng)业者服务平台GoDaddy对(duì)全美1003家小型企业(yè)的调查数据(jù)显示，ChatGPT以70%的应(yīng)用率成为美国(guó)小型企业应用最多的生(shēng)成式AI产品，这说明OpenAI选择的闭源模式的商业化之路在一(yī)定程度已经跑(pǎo)通。

开源模型如何寻求生存和发展(zhǎn)的机(jī)会？

首先是以开(kāi)放(fàng)的生态吸引用户。国盛证券研报就指出，开源大模型借(jiè)助更大标(biāo)识符训练数据(jù)集、DeepSpeed、RLHF等方式，实现低训练(liàn)成本和(hé)高性能，超大模型以下(xià)大(dà)模型的壁垒正在消失(shī)。

“在拥有用户(hù)后(hòu)，开(kāi)源大模型通常通过提供增值服务、定制开发、技术支持等方式(shì)来实现盈利(lì)”。郭(guō)涛指出，公司(sī)可以在开源模型(xíng)的基础上(shàng)提供(gōng)专业的训练(liàn)服务(wù)或者定制化的应用解决方案。

对于(yú)Meta甚至众多开源者而言，开源的野心不仅是短期的商业(yè)变现，其(qí)更想(xiǎng)引领规则设计以及搭建生态。有业内专家分析，开(kāi)源后壁垒(lěi)并没有那么容易破除，高(gāo)质量、标注过(guò)的训练数据集尤(yóu)其是专业模型的壁(bì)垒。

星纪魅族集团数据合规执行总监朱玲凤表示，目(mù)前有些开源AI由头部公司主导(dǎo)，“越多(duō)人使用，就越能强化网格效应，而且(qiě)不是真正(zhèng)的开放(fàng)，后(hòu)续需要使用它们的(de)配套工具、配套服务。头部公司还可能(néng)利用(yòng)监管豁(huō)免的方(fāng)式(shì)，获得寻(xún)租空间。”换言之，以开(kāi)源为噱头的巨头游戏，可能会进一步强化大公司的垄断地位，反而(ér)不利于产业竞争。

据报道，去年4月，在扎克伯格与分析(xī)师的一次电话会议中，他就谈到，如果行业能够在Meta使用(yòng)的基础工具上达成标准化，那么meta就能从其他(tā)人的改进(jìn)中受益。同年5月(yuè)，谷歌内部泄露的文件《我(wǒ)们没(méi)有护城河，OpenAI也没有(yǒu)》在SemiAnalysis网站(zhàn)上传播(bō)，其(qí)中的观点包括，比(bǐ)起开源(yuán)社区需要谷歌，谷歌更需(xū)要开源社区等(děng)等。文章作者指出，不同开源模型(xíng)所组成(chéng)的(de)生态系统永远是OpenAI的潜在竞争对手，与开源AI竞争的结果必然是失败。

Meta落子，战局生变(biàn)。大模型的路线之(zhī)争会不会迎来真正的胜利者？

“开(kāi)源与(yǔ)闭源大模型之间不(bù)太可(kě)能分出绝(jué)对的输赢，因(yīn)为它们各自适合(hé)不同的应用和场景。”郭(guō)涛认为，开源大(dà)模(mó)型更适合那些需(xū)要快速创新和大规模协作的项目，而闭源大模(mó)型可(kě)能更适(shì)合那些对性能和安全性(xìng)有极(jí)高要(yào)求(qiú)的商业应(yīng)用(yòng)。

未经允许不得转载：IDC站长站，IDC站长，IDC资讯--IDC站长站今日42只A股跌停有色金属行业跌幅最大