你的位置:九游娱乐(中国)有限公司-官方网站 > 资讯 >

j9九游会官方以及由Trainium2 驱动的EC2实例矜重可用-九游娱乐(中国)有限公司-官方网站

j9九游会官方以及由Trainium2 驱动的EC2实例矜重可用-九游娱乐(中国)有限公司-官方网站

文|光锥智能 白 鸽

编|王一粟

“性价比、降资本、实用AI”。在亚马逊云科技2024年度re:Invent大会上,这些词成为了亚马逊云科技All in生成式AI的环节词。

面前,大模子行业合座的风向仍是发生迂曲,从蓝本All in预熟谙大模子,冉冉转为欺压收缩预熟谙领域,加快大模子的推理和应用。

有位业内东说念主士跟光锥智能暗意:“明天大家大略作念通用大模子预熟谙的玩家不会稀奇50家。”

这也就意味着,越来越多的企业驱动转型作念大模子的推理和应用落地,而这些玩家最典型的特征,即是会愈加小心干涉产出比,以及怎么通过大模子为本身达成降本增效。

但大模子的落地应用无疑将是一场漫长的干戈。就像亚马逊云科技新任 CEO Matt Garman所说:“东说念主工智能是一场莫得颠倒的竞赛,它将经久抓续下去。”

算作大家云诡计厂商的老老迈,生成式AI无疑是亚马逊云科技拆开错过的赛说念。

为知足更多大模子落地应用需求,在这场大会上,亚马逊云科技全方向展示了从诡计、存储、数据库、推理、东说念主工智能、生成式AI应用等方面的体系化更新恶果,并仍是构建了从底层AI芯片,到中间大模子平台,再到表层生成式AI应用的圆善AI本事栈和基础设施。

通过这次大会也大略看出,从客岁的相对低调,到本年年中的“转稳为攻”,再到年尾的“全面开战”,亚马逊云科技在生成式AI的这场“无限”的干戈中,驱动支棱起来了。

亚马逊首席实施官Andy Jassy在演讲中也明确了亚马逊云在生成式AI期间的发展旅途,“咱们一定会优先磋商那些果真对客户伏击的本事,专注为客户处分本色的问题。”

也即是说,从真实客户需求启航,亚马逊云科技通过诈骗本身在基础设施、用具/模子和应用三层面的累积和实力,大略给客户多提供了一个“快、好、省”的选项。而这无疑大略让亚马逊云科技,再次坐稳云诡计行业的“铁王座”。

全新一代芯片+熟谙集群,让大模子熟谙部署更具性价比

经济基础决定表层建筑,云诡计的基础雷同也决定了大模子发展的明天。

Andy Jassy暗意:“当生成式AI应用达到一定例模时,诡计资本将至关伏击。”但面前大家范围内,大大宗生成式AI应用齐主要依赖某一种芯片进行诡计。

因此,行业但愿大略领有具有更高性价比的处分有计算。

那么,东说念主工智能期间果真的的基础设施究竟是什么样的?亚马逊云科技高档副总裁Peter DeSantis建议构建东说念主工智能基础设施的两个基本复旧:

构建更强的职业器;

构建更大领域、更高效力的职业器集群;

而不管是职业器如故职业器集群,齐离不开最基础的、高性能的GPU芯片。

Trainium是亚马逊云科技自研的AI芯片,2020 年头次推出,曾一度被认为是熟谙AI模子最具效力的芯片。在这次re:Invent大会上,亚马逊云科技布告Trainium2芯片,以及由Trainium2 驱动的EC2实例矜重可用,并推出Trainium2 Server和Trainium2 UltraServer,这将使用户大略以更高的性能和资本效力熟谙和部署东说念主工智能模子。

据先容,Amazon EC2 Trn2实例,集成了16个Trainium2芯片,由高带宽低延伸的NeuronLink本事达成互连,单节点提供20.8 pFLOPS FP8算力,相较GPU实例,Trn2实例的性价比高出30%至40%,专为生成式AI熟谙和推理而构建。

在测试中,与其他云职业商的类似居品比拟,使用Amazon Trn2 EC2实例的Llama 3.1 405B 模子token生成浑沌量提高了三倍以上。

面前,Adobe、Poolside、Databricks、Qualcomm等调动公司已大领域干涉使用Trainium2。

Matt现场还布告将在2025年推出Trainium3芯片。Trainium3是亚马逊云科技基于3纳米先进工艺制造的首款芯片,是Trainium2性能的两倍,同期能效擢升40%。

但面临大模子的熟谙需求,单一芯片还远远不够。亚马逊云科技通过独到神经元连系本事NeuronLink,将64个Trainium2芯片合成了一个Ultra职业器。其诡计容量是面前AI职业器的5倍。带宽亦然高达2TB每秒,但延伸只须1微秒。

Anthropic也布告,下一代Claude模子将在包含数十万个Trainium2芯片的Project Rainier集群中进行熟谙。

面前,除诡计除外,影响大模子熟谙和推理的,还有存储和数据库等软件系统。这次大会上,亚马逊云科技也同步更新了存储和数据库体系。

存储方面,亚马逊云科技全新发布Amazon S3 Tables,是专为Iceberg设想的全新式存储类别,以嘱托快速增长的数据湖需求。

据先容,Amazon S3 Tables可提高统共Iceberg表的性能和可推广性。针对存储在S3中的Parquet文献类型,可取得3倍的查询性能及每秒事务量10倍擢升。这使得S3全齐再行界说了面向数据湖的对象存储,提供更好的性能、资本和领域推广才气。

而当达到PB或EB级别存储领域时,元数据(metadata)就变得相等伏击。元数据可匡助组织了解存储在S3中的对象的信息,从而找到所需的数据。

基于此,亚马逊云科技矜重发布Amazon S3 metadata职业,可自动从对象中索要元数据,并近及时地将其存储在新的S3Tables桶中(Iceberg表),以支抓后续使用分析用具进行元数据查询。当对象发生变化时,S3会自动在几分钟内更新相应的元数据。

这无疑处分了大领域数据分析中的元数据管束挑战,让行业用户大略高效发现和诈骗数据而不消从事近似性的基础设施构建责任。

在数据库方面,亚马逊云科技全新发布了Amazon Aurora DSQL,其具有免运维体验的分辩式SQL数据库,可在大家范围内达成跨区域部署,并无限推广,具备99.999%的多区域高可用性及强数据一致性,同期兼顾低延伸,是迄今为止最快的大家化部署的分辩式SQL数据库,比Google Spanner快4倍。

同期,针对NoSQL数据库,亚马逊云科技也发布了Amazon DynamoDB global tables的多区域强一致性功能。至此,不管客户需要SQL如故NoSQL,亚马逊云科技齐不错提供在大家可快速推广的高可用数据库,支抓数据强一致支抓,并具备极低的读写延伸。

关于现阶段的云厂商们来说,比拟于AI大模子职业,算力无疑是最挣钱的一块业务。但面向明天,AI大模子的职业和应用,也将至关伏击。Jassy在10月份的财报回顾时暗意,本年,亚马逊的云诡计业务增长态势彰着,该公司的东说念主工智能职业仍是创造了数十亿好意思元的年化收入。

自研+集成百余款大模子!遴荐的权柄,大于一切

“遴荐决定一切!用模子的时刻,需要有许多可选的目田!”Andy Jassy在大会上如斯说说念。

一句话,就仍是标明了亚马逊云科技在大模子职业上的作风,亚马逊云科技通过集成更多的大模子居品,来让用户在遴荐大模子使用上不受限。而这一完了,也源自于亚马逊云科技里面在作念AI应用落地的不雅察。

“咱们惊诧的发现,即使在亚马逊里面,生成式AI应用的设立过程中所使用的模子种类也相等各种化。”Andy Jassy说说念,“咱们一次又一次地学习到雷同的教养,那即是——经久不会有‘一统天地的用具’。正如数据库领域一样,咱们曩昔十年一直在商量,东说念主们使用的是多种关联型或非关联型数据库。”

可是,这并不料味着亚马逊云科技湮灭自研大模子居品。

在演讲中,Andy Jassy也提到,亚马逊云科技里面在设立应用环节的过程中,里面设立者向亚马逊的模子团队建议了各式需求,包括但愿模子有更低的延伸和更低的资本;望大略进行微调,以通过记号样本进一步优化应用性能;需要更好的图像和视频处理才气等等。

这些需求相等平凡,现如今的大模子厂商并不玉成齐知足这些需求。

因此,除集成大模子居品除外,亚马逊云科技也矜重发布自家新款“大模子全家桶”—Amazon Nova,涵盖文本对话、图片生成、视频生成,明天不仅要达成Speech to Speech,更要Any-to-Any!

据先容,新发布的Amazon Nova基础模子共包括四大模子:

可用于肤浅任务的超高性价比翰墨处理Micro模子;

三种多模态模子——低资本的Lite模子;

兼具准确性、速率和资本的Pro模子;

用于复杂的推理任务同期也可进行蒸馏定制的Premier模子。

具体到功能方面,Nova模子支抓微调(Fine-tuning),蒸馏(Distillation)熟谙更小的模子,让大模子的使用效力擢升的情况下,还能裁汰资本。同期,Nova模子与Amazon Bedrock学问库深度集成,可用于RAG,以根据我方的数据生成反应。性能层面,Amazon Nova模子与同类模子比拟,Nova在统共基准测试中齐是至极或更好,极具竞争力。

现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从获利中不出丑出,其在检索增强生成(RAG)、函数调用和智能体应用方面具有较好的性能。

同期,亚马逊云科技还重磅推出两个全新模子:Amazon Nova Canvas高质料图像生成模子,Amazon Nova Reel高质料视频生成模子。其中,Amazon Nova Reel支抓生成六秒的视频,明天几个月将支抓生成两分钟视频。

在后续的居品诡计中,Andy则暗意,在2025年一季度控制,亚马逊云科技将提供语音到语音的模子,允许输入语音,取得深远的语音输出。在2025年年中控制,将提供多模态输入到多模态输出的前沿模子,支抓文本、语音、图像及视频。

面前,亚马逊云科技自研的大模子居品仍是上架亚马逊云科技的“模子工场”Amazon Bedrock,而Premier版块则将于2025年第一季度推出。

除自研大模子除外,为了大略让用户不受限,亚马逊云科技数据和东说念主工智能部门副总裁 Swami Sivasubramanian在大会上暗意:“百款基础模子疏漏挑!亚马逊云科技布告推出Amazon Bedrock Marketplace,用户不错松开调用100多款起先的大模子。”

面前Amazon Bedrock还上新了包括poolside Assistant、Stable Diffusion 3.5、Luma AI等在内的大模子。

跟着大模子的加快落地应用,推理也将成为生成式AI责任流中的中枢。

Matt在大会上也暗意:“推理在AI模子的应用中变得尤为伏击,尤其是在处理像大型话语模子等复杂模子时,推理条件极高的诡计才气和低延伸反应。”

而为了知足更多客户对大模子推理当用的需求,这次Amazon Bedrock也迎来多项才气的升级,使得用户不错通过Amazon Bedrock方便探问Inferentia和Trainium芯片提供的推理的硬件优化资源。

比如模子蒸馏功能,其大略擢升推理速率高达500%,资本裁汰75%,用户只需提供应用示例请示,Amazon Bedrock会为用户自动完成蒸馏过程,最终取得一个定制的、具备专科学问、合理延伸和合感性价比的蒸馏模子。

面临企业级应用,为退守大模子幻觉问题,亚马逊云科技发布自动推理查验功能,有助于检测幻觉、提供可考据的左证默契注解大型话语模子的准确性。

关于Agent智能体的应用,则发布Amazon Bedrock multi-agentcollaboration(多智能体配合),不错支抓复杂责任经过。在性能方面,Amazon Bedrock还推出了低延伸优化推理,由此,用户不错在使用伊始进的大模子基础上,还享受不凡的推感性能。

数据浮现,面前每天齐罕有万名客户使用Amazon Bedrock创建应用环节,比曩昔一年增长了5倍。而通过Amazon Bedrock,亚马逊云科技云职业也达成既与多家模子提供商有着深厚的合作关联,同期也集成自研大模子居品,最终大略为用户提供最平凡、最优质的功能遴荐。

开箱即用的AI应用,加快大模子落地

有了底层算力基础设施的支抓,有了不错节略遴荐的大模子平台用具,但思要果真设立出一个优秀的生成式AI应用,却依然会存在相等多的贫瘠。

不仅需要一个优秀的模子,在模子除外,还需要合适的需要合适的安全设施、深远的话语抒发、讲究的用户界面(UI)以及合理的延伸发扬——用户不但愿体验到自如或卡顿。还需要一个优化的资本结构。

在Andy Jassy看来,在很厚情况下,你会合计我方有了一个很好的模子,稍加设立就能构建出一个优秀的生成式AI应用。但事实是,你可能只完成了70%的责任。试验是,客户不会宽厚那些仍有30%问题的应用。

因此,思要果真设立一款好用且优秀的AI应用,离不开云厂商们提供的大略开箱即用的AI应用设立平台用具。

亚马逊云科技的AI应用平台Amazon Q 为用户提供了丰富的AI应用用具。

其中,Amazon Q Developer,这次全新全新推出三个Agent,用于生成单位测试、文档和代码审查,不错匡助处分这个设立东说念主员端到端的开提问题。

Swami现场暗意:“Amazon Q Developer登顶了SWE基准测试TOP1!松开处分55.8%的软件问题,德甲、好意思国航空、英国电信齐在使用。”

Amazon Q Business,不错意会为是亚马逊云科技为企业提供的数据联接用具,大略为企业数据创建了一个索引,联接不同的业务系统、企业数据源,不管这些数据源来自亚马逊云科技、第三方应用环节,统共这些数据齐不错在安全和秘密的前提下进行更好的搜索,并越过各式数据库与统共企业数据进行对话。

在Q Business之下,亚马逊这次发布了将QuickSight和Q Business的数据一齐结合的新功能,通过QuickSight和Q Business以及与之磋磨联的系统,举例Salesforce系统数据拉入QuickSight讲述快速得到愈加全面的QuickSight状貌板,使QuickSight算作BI用具变得愈加浩大。

Amazon SageMaker由于被越来越多客户用来处理和准备他们的数据,用于机器学习的责任负载。因此,亚马逊云科技将其再行定位为职业数据、分析和东说念主工智能需求的中心。

全新发布的Amazon SageMakerUnified Studio,则不错提供整合的数据和东说念主工智能设立环境,允许客户探问组织中的所罕有据,并使用最相宜的用具。它大略将面前亚马逊云科技各式职业,包括Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中独处的Studio,查询裁剪器,以及各式可视化用具等,整合到现有的Amazon SageMaker Studio中。

“Amazon SageMaker仍是成为所罕有据分析和AI的一站式平台,分析责任化繁为简,再行界说了生成式AI的游戏端正。”Swami如斯说说念。

面前,在大家范围内,各大企业齐但愿大略通过生成式AI达成降本增效。同期,各大大家企业巨头,在研究生成式AI的同期,也会率先在我方里面业务场景中落地应用。

亚马逊里面雷同如斯。基于生成式AI,亚马逊仍是将生成式AI落地到企业里面多个应用场景中,包括:Alexa 语音助手矫正、电商告白创作、手掌支付、无东说念主值守零卖职业区和处方药阅读等。

而通过里面复杂数字生态场景所试真金不怕火出来的才气,在输出给亚马逊云科技的用户,无疑将大略给用户带来更好的体验。

综上来看,这次亚马逊云科技的重心,则落在了大模子的推理和应用层面,正在全经过裁汰生成式AI构建的门槛,以及推理和应用的资本。

比拟于OpenAI对AGI的追求j9九游会官方,无疑亚马逊云科技更小心本色,而这背后,齐离不开其“一切从客户真实需求启航”的本事研发准则。



相关资讯