IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开源还是闭源?这是属于大模(mó)型的时代之问。

今年年初,埃隆·马斯克在对OpenAI及其CEO萨姆 ·奥特曼提起诉讼时,就对OpenAI逐渐(jiàn)不公开其模型研究相关细节的行为大加谴责。“时至今(jīn)日,OpenAI公司网(wǎng)站还宣称,它(tā)的宗旨(zhǐ)是确保 通用人工智能(néng)造福全人类。然(rán)而,在现实中,OpenAI已经转变为科技巨(jù)头(tóu)微(wēi)软事实上的闭源子(zi)公司。”这位曾经的OpenAI联合创始(shǐ)人如此(cǐ)表示 。

OpenAI不够“Open”,Meta却“Open”了自己最新的开源人 工智能模型。

4月18日,Meta 发布了其最新版(bǎn)本的开源大模型 Llama 3,引起开源AI社区的一阵欢呼。巧合的是,Llama 3发布当(dāng)天(tiān)正好是AI领域顶 尖学者、AI开源倡导者吴恩达的生日。“(Llama 3是(shì))至今为止最好的礼物,谢感谢Meta!”他说。

行至2024,开(kāi)闭源之争日渐白热化。闭(bì)源阵(zhèn)营以目(mù)前最强的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和(hé)Google等也在不断迭(dié)代。闭源阵(zhèn)营坚(jiān)持对Scaling Law的(de)信仰,押注在更强通用模型(xíng)的打造上;开源阵营模型能(néng)力不断(duàn)提升,并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地。

关于应该选择(zé)模型开源还是闭源讨论经久不(bù)息。

对于局内人,这一选(xuǎn)择这不仅决定了他们将 如何点(diǎn)亮(liàng)AI“科技树”,更将(jiāng)影响他们的商业路 线选择。换言(yán)之,这(zhè)很有可能(néng)是这(zhè)个残 酷竞 争市场下(xià)的生存问题(tí)。

两个版本,多(duō)重惊喜

Meta此次(cì)发(fā)布的(de)Llame 3包括8B和70B的预训练和指令微调版本(běn)。

据Meta官网信息,Llama 3 模型(xíng)将数据和规模提升到新的高度。它 在两个定制24K GPU集(jí)群上(shàng)基于超过 15T 的数据进行了训练(liàn)——训练数据集是Llame 2使用量的7倍有余。它支持 8K 上下文长度,是 Llama 2 容量 的两倍(bèi)。

除了 Llama 3,Meta 还发(fā)布(bù)了新的信任和安全工具,包括(kuò)Llama Guard 2、Code Shield和 CyberSec Eval 2。

据(jù)悉(xī),Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主(zhǔ)要云提供商、模型 API 提供商平(píng)台上线,Llama还得到AMD、AWS、戴尔、英特(tè)尔、NVIDIA和高通(tōng)提供的(de)硬件平台(tái)的支持。

在官网上,Meta还放出了Llama3两个(gè)版本与谷(gǔ)歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争(zhēng)对手 的(de)参(cān)数对比。据Meta官网,Llame3在MMLU(学科知(zhī)识理(lǐ)解)、GPQA(一般问题)、HumanEval(代码能力)、GSM—8K(数(shù)学(xué)能力(lì))、MATH(比(bǐ)较难的数学问题)5个评测集上均表现良好。

值得注意(yì)的是,Llama3的代(dài)码能(néng)力非常优秀。在AI领域公众号“数字生(shēng)命卡兹克”主理人卡兹克分享 的用户实(shí)测中,Llama3—8B能够(gòu)给(gěi)出国际象棋中经(jīng)典皇后问题的解题代(dài)码。而其前代版本Llama2需(xū)要(yào)专门的代码模型才能(néng)实现。

市场的反应速度很快。18日当(dāng)天,Meta股价逆势收涨1.54%。次(cì)日,百度智能云(yún)千帆(fān)大模型平台开放邀约测试,提供针对Llama 3的训练(liàn)推理方案,帮助开发者训练专属(shǔ)大模型。

8B和70B 两个(gè)型号的模型(xíng),仅仅标志(zhì)着 Llama 3 系列的(de)开端,Meta AI首席科学家杨立昆在其社交媒(méi)体透露,在接下来的几个月,还会有更多版本(běn)陆续发布。

英伟达高级科学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版(bǎn)本将(jiāng)成(chéng)为某种“分水岭(lǐng)”,开源社区将能用上GPT-4级别的模型。

不下牌桌,各显神通

上一 轮元宇(yǔ)宙竞争(zhēng)中被认为可能跌进坑里的(de)Meta,在人工智(zhì)能的牌桌上打出了Llama系(xì)列这把好牌。要讨论Llama3带(dài)来的行业震(zhèn)荡,首先要明白,什么是(shì)大模(mó)型领域的开(kāi)源(yuán)?

大模型领(lǐng)域的开源(yuán)通常意味着模型的架构、训(xùn)练代码和预训(xùn)练(liàn)权重(zhòng)等都(dōu)被公开(kāi),允许研究(jiū)人员和开发者(zhě)自由地访问和(hé)使用。

不过,开(kāi)源的程度因模型而异。“有些可能只提供有限的访(fǎng)问权限(xiàn)或部分代码。”郭涛 指出,判断大模型是否真正开(kāi)源的基准可能包括:代码和数(shù)据的可访问性、使用许可的宽(kuān)松(sōng)程度、社区支持的活跃度以及对改进和新应用的开放性(xìng)。

放眼AI界,两条路径上都各(gè)有(yǒu)“头号玩(wán)家”分布。闭源(yuán)自不必说,海外有OpenAI旗下的ChatGPT,国(guó)内是百度的文心一言以及风(fēng)头正劲的月之暗面Kimi。

而开源(yuán)方面,除(chú)了Llama系列,目前应用较广的开源大模型还包括非营利组织LAION推(tuī)出的OpenFlamingo、Databricks的Dolly,以及MosaicML的(de)MPT等(děng)。国内则包括,阿里(lǐ)巴(bā)巴的通义千问,智谱的ChatGLM-4、百川(chuān)智能的baichuan-7B中英文大模型(xíng)、北(běi)京智源(yuán)悟道(dào)3.0大 模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样 的分化,很多时候是受技术进步和(hé)商 业模式迭代等的多重(zhòng)影响。

天(tiān)使投资人(rén)、资深人工(gōng)智(zhì)能专家郭涛认为,从技术角度 来看,开(kāi)源可以促进学(xué)术界的研(yán)究和创新,而闭 源则有助于在一定时(shí)间内保持技术领先优势。

从商业角度来看,开源可(kě)以吸引开发(fā)者社区(qū)的贡献,促(cù)进技术的快速迭代和应用的(de)广泛传播,但可能会影(yǐng)响到公司的盈利模式(shì)今日42只A股跌停 有色金属行业跌幅最大。闭源则可以保(bǎo)护知(zhī)识产权,为公(gōng)司创造直接的收入来(lái)源 ,但可(kě)能会限制技术的普(pǔ)及和生态的建设。

事实上,在Llama3发布之前,中文互联网刚刚经历了一轮开(kāi)闭源论战。

据媒(méi)体报道(dào),百度(dù)CEO李(lǐ)彦宏近日(rì)表态,认为大模(mó今日42只A股跌停 有色金属行业跌幅最大)型开源意义不大,闭源模型性能会不断提(tí)升。“有了(le)文心大模型4.0,我们可(kě)以根据(jù)需要兼顾效果、响 应速(sù)度(dù)、推理成本等各种考虑,裁剪出适合各种场景的(de)更小(xiǎo)尺寸模型,且支(zhī)持精调和post pretrain。通过(guò)降维裁剪出的模型,比直(zhí)接拿开源调出 来的模型,同等尺(chǐ)寸下效(xiào)果更好,同(tóng)等效果下成本明显更低(dī)。”

李彦宏一直是(shì)闭源路线的忠实拥趸,理(lǐ)由包括(kuò)但不限于认可 闭源商业模式可以更(gèng)好(hǎo)地聚集人力和财力(lì)等。

而其反对者——360创始(shǐ)人周(zhōu)鸿祎言(yán)简意赅(gāi),“一句话,今天没有开源就没有 Linux,没有(yǒu) Linux 就没有互联网。”

“源神(shén)”启(qǐ)动(dòng),影响(xiǎng)几何?

“Llama 3的发布会带(dài)来市场格局的改变。”郭涛在接受21记(jì)者(zhě)采(cǎi)访时指出,其优异表现(xiàn)可能吸引更多的用户和投资者,从而(ér)增加其市场份额(é)。

官网显示(shì),Llama 3将有条件地开源给商业使(shǐ)用(月活用户超过(guò)7亿需要(yào)单(dān)独申请)。“不过这基(jī)本(běn)等于完全(quán)免费商用了。”卡兹克表示。

此前,投资(zī)人朱啸虎曾经就人工智能市场相关(guān)话题接受腾讯(xùn)新闻采访。当(dāng)被问及2023年大模型(xíng)发展的关键(jiàn)节点时,他(tā)给出的回(huí)答正是(shì)Llama上线。这让中(zhōng)国在应用层 面创新有了基础,降低了商业化(huà)门槛。

当然,朱(zhū)啸虎提到的变现是指开源生态内的用户(hù)。对于开源大模型发布者的能否盈(yíng)利(lì),或者(zhě)能等来盈(yíng)利机会,很多时候(hòu)并没(méi)有确(què)定的答案。

闭源大模(mó)型通常通过授权使用、订阅服(fú)务或者直接销售产品(pǐn)来盈利(lì)。其中的代表(biǎo)便是AI领域(yù)的领(lǐng)跑者OpenAI,虽然其一直有推进开源项目(mù)的动作,但其处在核心地位的ChatGPT却一直采取收取API许可(kě)费的(de)方式向其他公司提供(gōng)服务。在API服务过程,其(qí)他公司不会接触到ChatGPT模型的细节和源代(dài)码,仅仅通过API接口(kǒu)进行调用。

创(chuàng)业者服务平台GoDaddy对(duì)全美1003家小型企业(yè)的调查数据(jù)显示,ChatGPT以70%的应(yīng)用率成为美国(guó)小型企业应用最多的生(shēng)成式AI产品,这说明OpenAI选择的闭源模式的商业化之路在一(yī)定程度已经 跑(pǎo)通。

开源模型如何寻求生存和发展(zhǎn)的机(jī)会?

首先是以开(kāi)放(fàng)的生态吸引用户。国盛证券研报就指出,开源大模型借(jiè)助更大标(biāo)识符训练数据(jù)集、DeepSpeed、RLHF等方式,实现低训练(liàn)成本和(hé)高性能,超大模型以下(xià)大(dà)模型的壁垒正在消失(shī)。

“在拥有用户(hù)后(hòu),开(kāi)源大模 型通常通过提供增值服务、定制开发、技 术支持等方式(shì)来实现盈利(lì)”。郭(guō)涛指出,公司(sī)可以在开源模型(xíng)的基础上(shàng)提供(gōng)专业的训练(liàn)服务(wù)或者 定 制化的应用解决方案。

对于(yú)Meta甚至众多开源者而言,开源的野心不仅是短期的商业(yè)变现,其(qí)更想(xiǎng)引领规则设计以及搭建生态。有业内专家分析,开(kāi)源后壁垒(lěi)并没有那么容易破除,高(gāo)质量、标注 过(guò)的训练数据集尤(yóu)其是专业模型的壁(bì)垒。

星纪魅族集团数据合规执行总监朱玲凤表示,目(mù)前有些开源AI由头部公司主导(dǎo),“越多(duō)人使用,就越能强化网格效应,而且(qiě)不是真正(zhèng)的开放(fàng),后(hòu)续需 要使用它们的(de)配套工具、配套服务。头部公司还可能(néng)利用(yòng)监管豁(huō)免的方(fāng)式(shì),获得寻(xún)租空间。”换言之,以开(kāi)源为噱头的巨头游戏,可能会进一步强化大公司的垄断地位,反而(ér)不 利于产业竞争。

据报道,去年4月,在扎克伯格与分析(xī)师的一 次电话会议中,他就谈到,如果行业能够在Meta使用(yòng)的基础工具上达成标准化,那么meta就能从其他(tā)人的改进(jìn)中受益。同年5月(yuè),谷歌内部泄露的文件《我(wǒ)们没(méi)有护城河,OpenAI也没有(yǒu)》在SemiAnalysis网站(zhàn)上传播(bō),其(qí)中的观点包括,比(bǐ)起开源(yuán)社区需要谷歌,谷歌更需(xū)要开源社区等(děng)等。文章作者指出,不同开源模型(xíng)所组成(chéng)的(de)生态系统永远是OpenAI的潜在竞争对手,与开源AI竞争的结果必然是失败。

Meta落子,战局生变(biàn)。大模型的路线之(zhī)争会不会迎来真正的胜利者?

“开(kāi)源与(yǔ)闭源大模型之间不(bù)太可(kě)能分出绝(jué)对的输赢,因(yīn)为它们各自适合(hé)不同的应用和场景。”郭(guō)涛认为,开源大(dà)模(mó)型更适合那些需(xū)要快速创新和大规模协作的项目,而闭源大模(mó)型可(kě)能更适(shì)合那些对性能和安全性(xìng)有极(jí)高要(yào)求(qiú)的商业应(yīng)用(yòng)。

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 今日42只A股跌停 有色金属行业跌幅最大

评论

5+2=