法德争夺“欧洲版OpenAI”
OpenAI作为这次AI热潮的导火索和行业领先者,对行业生态有广泛和深远的影响。后进者们纷纷以OpenAI的成就为目标,致力于开发自己的大模型技术。在法国,有一家公司被视为OpenAI在欧洲的主要竞争对手,法国总统马克龙称其是“法国天才”。这家备受瞩目的公司名为Mistral AI,2023年4月在巴黎成立。Mistral AI由前DeepMind和Meta的科学家共同组建,主要聚焦开源模型及企业级服务。Mistral AI开源的Mistral系列大模型受到了业界的广泛赞誉。2024年4月,Mistral AI推出了全新专家混合(MoE)大模型Mixtral8x22B磁力链接。该模型在文本生成、问答理解等方面表现出色。Mixtral8x22B的具体特点包括对64K超长上下文的支持,多语言能力,尤其在法语、德语、西班牙语等语言上表现流畅,以及采用Apache2.0开源协议等。与相应规模的开源模型对比,除了部分评测不如Command R+外,Mixtral 8x22B模型在其它结果都大幅领先。根据社区评测,Mistral 8X22B在多项基准测试中的表现超越了当前市场上的主流模型,如GPT-3.5和Llama 2(Meta开发的大语言模型),甚至有潜力与OpenAI的最新的GPT-4 Turbo相提并论。这样快速的进步和技术创新也吸引了大量投资者的关注。在该公司B轮融资中筹集到了6亿欧元(约合6.4亿美元或47亿元),新融资使得Mistral AI估值达到60亿欧元(约合64亿美元或470亿元)。该轮融资由美国的风险投资公司General Catalyst领投,其他投资者包括Lightspeed、法国巴黎银行、英伟达、Salesforce、三星等。资本的注入为Mistral AI的技术发展提供了强大动力,而该公司在技术合作方面的战略布局同样引人注目。Mistral AI与微软建立了长期合作伙伴关系,利用Azure AI的超级计算基础设施进行模型训练,共同为客户提供MIstral AI的模型服务,成为继OpenAI后第二家在微软Azure云平台上提供商业语言模型的公司。将目光从法国转向欧洲大陆的另一个工业大国——德国,其也有着自己的OpenAI。成立于2019年的人工智能初创公司Aleph Alpha,将自身定位为欧洲本地AI技术的领导者。2023年,Aleph Alpha在资本市场上取得了显著成就,当年6月,Aleph Alpha获得1亿欧元A+轮融资,晋级德国AI独角兽。2023年底,Aleph Alpha宣布完成超5亿美元规模的B轮融资。该轮融资的投资方主要来自于德国本土,由创新园人工智能(Ipai)、博世风险投资(BoschVentures)和施瓦茨集团(SchwarzGroup)的公司领投。Aleph Alpha主打“数据主权”的概念,即存储在某个国家的数据受该国法律的约束,以确保数据的安全性。其生成式人工智能解决方案致力于为企业和政府提供突破性的人工智能技术。技术层面上,Aleph Alpha自研的Luminous系列大语言模型,与ChatGPT的功能类似,提供生成文本/代码、总结内容、翻译等服务。2022年4月,AlephAlpha发布了Luminous系列第一个大语言模型,有130亿、300亿和700亿三种参数。生成内容可解释性是该模型的技术亮点,可以帮助客户确保模型安全、可靠地处理其数据,并对生成的内容进行合理的解释。Transformer创始八子缔造大模型独角兽
人工智能领域近年来的一系列突破性进展,如ChatGPT很大程度上要归功于一种名为Transformer的模型架构,该架构提供了一种更有效的方式来训练大型语言模型。Transformer在《Attention is All You Need》论文中首次提出,该论文由8位作者共同撰写。起初,Transformer模型在谷歌内部迅速流行并得到广泛应用。然而,这一模型在谷歌之外的认知度和应用范围相对有限。为了尽快将想法推向市场,论文的8位作者选择离开原有的研究机构,投身于创业的浪潮中。在这些研究人员的引领下,也诞生了Character AI和Adept AI等初创公司,并迅速成长为市场上的独角兽。8位作者中,年轻且经验最少的Aidan Gomez也萌生了离开的想法。Aidan Gomez出生在加拿大,曾在多伦多大学攻读计算机专业。机缘巧合下,Aidan Gomez认识了多伦多大学校友华人Ivan Zhang。两人一拍即合,于是在2019年,Cohere创立于加拿大多伦多。随后在2020年,同样毕业于多伦多大学计算机科学系,曾是谷歌大脑Hinton团队成员的Nick Frosst加入了Cohere。值得一提的是,三位创始人均是90后。Aidan Gomez意识到,要使大模型技术得到更广泛的应用,需要克服两大障碍:首先是计算资源的限制,构建和训练大模型需要巨大的算力支持;其次是AI技术的高门槛,AI和机器学习领域的专业人才相对稀缺。因此,Cohere的愿景是创建一个平台,消除这些障碍,使得原本只有大公司和专家才能实现的复杂任务变得更加简单和易于访问。2024年4月,Cohere推出Command R+,该模型拥有1040亿参数,支持英语、中文、法语、德语等10种语言。在检索增强生成(RAG)能力和工具应用方面取得了突破性进展。据其发布的性能测试数据,在多语言、RAG、工具使用三大模块,Command R+的性能基本与GPT-4 Turbo差不多。与ChatGPT等大模型内卷To C市场不同,Cohere专注于To B市场,利用 AI 模型为企业应用提供人工智能服务,适用于写作、内容审核、数据分类和信息提取等多种业务应用。差异化战略也令Cohere在竞争激烈的人工智能市场中脱颖而出。据外媒报道,Cohere已经与Jasper、Salesforce等行业知名企业建立了合作关系。这一战略不仅扩大了Cohere的市场影响力,也为其带来了稳健的收益增长。截至今年3月底,Cohere的年化收入已经达到了3500万美元,显示出公司业务的强劲增长势头。得益于创始人的学术背景和行业经验,Cohere在早期就获得了众多AI领域重量级人物的支持,包括图灵奖得主Geoffrey Hinton、Uber首席科学家Raquel Urtasun、英伟达多伦多研究实验室主任Sanja Fidler以及斯坦福教授李飞飞等。2024年6月,据媒体报道,在拿到英伟达、Salesforce、思科等知名投资方的4.5亿美元融资后,Cohere估值飙升至50亿美元,成为大模型领域的又一独角兽企业。这轮融资不仅为Cohere的进一步发展提供了充足的资金支持,也反映了市场对其技术和愿景的高度认可。亚洲大模型独角兽多元化崛起
在亚洲,中国的大模型独角兽企业活跃,互联网大厂如百度、阿里、腾讯等凭借在各自领域的深厚积累,积极投身于这场科技竞赛。同时,一些早已声名显赫的大佬,如美团的王慧文、前搜狗CEO王小川等的加入为这场竞赛带来了新的变数,也为AI大模型的发展注入了新的活力。此外,一些新兴的大模型企业,如月之暗面、智谱AI等,也在这场竞赛中崭露头角。它们凭借独特的技术优势,拿到的一笔笔的融资额度不断刷新着记录。若将目光投向中国之外,AI领域的独角兽企业虽然数量不多,但每家公司都是该地区科技创新的璀璨明珠,具有不可替代的价值和独特性。印度,以其庞大的市场和人才储备,孕育出了本土的AI独角兽,成为了技术创新的热土。根据AMiner发布的《全球十个大模型核心团队成员分析报告》,印度的教育机构在全球AI领域扮演着举足轻重的角色。比如印度理工学院,它为全球十个大模型的核心团队输送了21位杰出人才,虽然仅占总数的2.2%,但这一比例在全球范围内的顶尖高校中已足够引人注目,凸显了印度在培养人工智能领域专业人才方面的显著成就和不懈努力。2024年是印度AI领域的一个重要转折点,当地AI初创公司Krutrim在完成经纬印度牵头的5000万美元融资后,估值达到了10亿美元的里程碑,正式迈入独角兽企业之列。这一成就不仅彰显了Krutrim的快速成长,也代表了印度在人工智能技术领域取得的又一显著进展。Krutrim由印度知名企业家、Ola网约车平台的创始人巴维什・阿加瓦尔(Bhavish Aggarwal)领导,该公司致力于大型语言模型(LLM)技术的开发与推广。公司名称Krutrim在梵语中意为“人工”,该公司还在开发数据中心,并设定了为AI生态系统制造服务器和超级计算机的宏伟目标。在技术成就方面,Krutrim已经成功推出了同名的大型语言模型。这款模型以印度本土数据为核心,通过使用超过2万亿个语料库进行训练。据悉,Krutrim模型不仅能理解20种印度语言,还能生成包括故事、诗歌在内的多种文本,证明了其在多语言处理和内容创作方面的卓越性能。从印度转向亚洲的另一端,位于亚洲西部的以色列,不仅属于亚洲版图的一部分,还是亚洲、欧洲和非洲三大洲的交汇点。独特的地理位置赋予了以色列丰富的文化多样性,也为其科技创新提供了独特的视角和机遇。在人工智能领域,以色列正以其深厚的科技创新和国防技术底蕴,孕育出本土AI独角兽企业。2023年,以色列AI大模型公司AI21 Labs 在C轮融资中获得1.55亿美元,其估值攀升至14亿美元,跻身独角兽之列。该次投资者包括Samsung Next、英伟达、谷歌等。AI21 Labs成立于2017年,总部位于以色列特拉维夫,由Ori Goshen、Amnon Shashua教授和斯坦福大学教授YoavShoham于2017年共同创立,其中Amnon Shashua是著名自动驾驶巨头Mobileye的联合创始人。AI21 Labs有基础大模型Jurassic-2,开发者平台AI21 studio,以及面向消费者的产品Wordtune和WordtuneRead。其中,Jurassic-2专注于“阅读和写作相关用例”,为应对大模型惯有的“幻觉”和可靠性问题,采用了一种创新的解决方案——MRKL Systems。这种方法通过结合一个或多个大型语言模型、外部知识库以及符号推理专家系统,有效降低了模型产生错误信息的风险。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/3369.html