今日观察!大模型价格战利好多方:推动普及避免浪费,加速中国AI发展

博主:admin admin 2024-07-04 00:44:47 690 0条评论

大模型价格战利好多方:推动普及避免浪费,加速中国AI发展

北京2024年6月14日讯 在今日举办的2024智源大会上,百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能联合创始人、CEO李大海共同出席《尖峰对话:通往AGI之路》环节,围绕大模型议题展开了精彩讨论。其中,王小川对近期兴起的大模型价格战表达了积极看法,认为这对于中国大模型的发展是一件好事。

王小川表示,价格战可以带来两个显著好处:首先,能够推动大模型的普及。此前,由于大模型的训练成本高昂,很多企业和个人望而却步。而价格战的出现,使得大模型的使用门槛大大降低,更多用户能够以更低的成本享受大模型带来的便利。这对于大模型生态的培育以及相关技术的应用落地都将起到积极作用。

其次,价格战可以避免社会资源的浪费。在价格战之前,一些企业或机构即使自身并不具备大模型的训练能力,也出于各种原因选择自行训练。这不仅造成了资源的闲置浪费,也阻碍了大模型技术在社会层面的共享协作。价格战的出现,使得那些不具备训练能力的用户可以将需求交给专业的厂商,从而避免了不必要的浪费。

王小川进一步指出,大模型的发展离不开数据的规模和算力的支撑。而价格战的推动,可以促使更多用户加入到大模型的训练和应用中,从而产生更多数据,反哺模型的训练,形成良性循环。同时,价格战也可以倒逼大模型厂商在技术和效率上不断创新,从而降低算力成本,提升服务质量。

总体而言,王小川认为,大模型价格战是市场竞争的必然结果,也是中国大模型发展过程中的一个重要阶段。这场价格战不仅能够推动大模型的普及和应用,还能促进相关技术的进步和产业的成熟,最终为中国AI的发展注入新的活力。

除了王小川的观点之外,其他参会嘉宾也对大模型的发展前景表达了乐观态度。他们认为,大模型作为人工智能技术发展的新阶段,拥有广阔的应用前景,将在各个领域发挥重要作用。随着技术的不断进步和成本的不断下降,大模型将走进千家万户,成为人们日常生活和工作中不可或缺的工具。

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

The End

发布于:2024-07-04 00:44:47,除非注明,否则均为今日新闻原创文章,转载请注明出处。