最好看的新闻,最实用的信息
11月05日 24.4°C-29.3°C
澳元 : 人民币=4.69
墨尔本
今日澳洲app下载
登录 注册

OpenAI“断供”,国产大模型如何落地有声?

2024-07-08 来源: 搜狐 原文链接 评论0条

六月底,OpenAI突然宣布,将于今年7月9日起终止所有来自中国的API申请。

“从7月9日起,我们将采取额外的措施阻止来自支持名单外区域的API,”OpenAI在公告中写道,“要继续使用OpenAl的服务,您需要在受支持的地区访问”。

机器翻译|OpenAI

这则公告在海外鲜少有人讨论,在国内AI业界却引发了不小的震动。因为中国大陆此前一直不在OpenAI的服务名单上,但对于国内的访问,OpenAI总是若即若离的态度——既不严格封禁,更不完全放开。而这次的公告则在传递一个相当明显的新信号,“睁一只眼闭一只眼”的蜜月期要结束了,接下来国产大模型要靠自己了。

中美之间的AI角力中,这不是第一次出现断链。去年10月17日,英伟达、AMD、因特尔等公司在美国商务部的要求之下,计划停止向中国出口先进的AI芯片,今年,美国财政部又最新出台一份规则草案,要求对美国在半导体和微电子、量子计算和人工智能领域的投资进行监管,禁止或限制中国在AI和其他技术领域的投资。

这次OpenAI断供,首当其冲的就是依赖OpenAI API的“套壳”创业公司,但对于国产大模型来说,这场断供潮正在迫使更多公司重新思考,OpenAI到底是不是个稳定而长久的选择,而这正是难得一遇的大好机会。

后OpenAI时代,到底有没有自主可控的强大底座能力做支撑,决定了国产大模型到底能在这条路上走多远。另一个问题是如何应用大模型,让它能真正发挥最大价值,只有这个问题得到解决,才能形成良性循环。

6月27日,就在OpenAI宣布退出中国后的两天,科大讯飞发布了星火V4.0大模型,给出了这两个问题的答案。

星火大模型V4.0

国产大模型新高度

在不少大模型厂商试图用低价和“一键搬家”从OpenAI手中抢用户时,国产大模型的代表科大讯飞选择从技术指标上直面GPT。

6月27日,科大讯飞创始人、董事长刘庆峰带来了讯飞了星火V4.0大模型的首秀,展示了星火大模型整体超越GPT-4 Turbo的硬实力,带来了一系列商业化落地应用。

而就在发布会前夕,科大讯飞刚刚荣获国家科学技术进步奖一等奖,成为本届国奖一等奖的唯一民营企业获奖者。这也是深度学习引发全球人工智能浪潮以来,十年间人工智能领域首个国家科学技术进步奖一等奖。

来源:品牌提供

在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,整体超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。在另一项中国科学院人工智能产学研创新联盟和长三角人工智能产业链联盟,在去年6月份联合发布的国产通用认知智能大模型测评体系中,讯飞星火V4.0在文本生成(80.2%)、语言理解(82.3%)、知识问答(85.7%)、逻辑推理(82.2%)、数学能力(86.5%)上都已经超越GPT-4 Turbo,仅在代码能力(81.2%)和多模态能力(78.4%)上还有差距。

来源:品牌提供

有趣的是,在多模态方面,星火大模型更侧重于专业领域,其图文识别能力在科研、金融、医疗、司法、办公、教育等场景的应用效果已领先GPT-4o。

来源:品牌提供

根据布会现场信息,比起GPT,星火大模型V4.0更加擅长利用已有资料进行联系推理,比如解读几张有联系的图片的关系,为其补全内容情节,并减少“幻觉”的出现——星火V4.0新增了长文本溯源功能,当它给出回答时,会同时给出信源,方便核实比对。

刘庆峰谈到,大模型已经不只是消磨时间的玩具或者执行简单任务的聊天机器人,而是正在成为真正的生产力工具。

自2023年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。“讯飞星火APP的使用高峰期不是周末,而是工作日;不是晚上,而是工作日的上午9:30和下午3:30,”刘庆峰说,“这说明大家真正用星火来解决工作中的刚需问题。我们一直说大模型应该是解放生产力、释放每个人想象力的,从这些数据就可以看到。”

让更先进的星火,照亮未来

用AI解放生产力,在一些行业看来还稍显科幻,但意料之外又情理之中的是,地球上战斗力最强的高知群体——海淀家长,已经开始用大模型押题了。

据家长群信息,海淀一部分家长把6月某全国大型考试历年的真题喂给大模型,让它帮助阅读提炼整理。然后问它“过去三年哪些知识点不考了?过去五年出现3次及以上的知识点是哪些?”甚至他们还问了去掉的知识点换成了哪些新的知识点,每年相比上一年的新知识点占比是多少?最后直接让AI给孩子出个模拟卷并给出答案。

在做题这件事上,AI可能真的比家长更擅长。在2024北京中考测试中,星火V4.0取得主客观题双双第一的成绩。在高考评测中获得语文作文51.5分(满分60),数学得分率71%的成绩,突破了AI在数学和创意写作上的瓶颈。

因材施教,有教无类,一直是过于理想化的教育理念,但有了AI之后,这个千年来的教育理想真的有可能实现。

7月5日,依托于新升级的星火V4.0,科大讯飞举行了主题为“新AI、新内容、新升级”的科大讯飞AI学习机暑期发布会。

来源:品牌提供

在发布会上,科大讯飞AI学习机迎来了包含AI一对一答疑辅导功能等方面的重大升级,旨在开创引导孩子主动思考与发问的全新互动讲题模式。

? 新教法

不同于传统的拍照搜题给视频讲解方式,升级后的AI一对一答疑辅导通过启发式互动讲解,引导孩子主动思考、发问,让孩子在与AI讲题学伴的个性化互动中自主解答出难题。即便孩子只是在某个点上卡住,AI学伴也能提供有效的指导。

比如用讯飞AI学习机分析英语题时,AI不直接给答案,而是通过一轮轮对话,耐心引导孩子自己做出判断。在现场演示的题目中,AI学伴向孩子提出问题,句子在讲的是什么事?是过去的事还是现在的事?在孩子给出基本判断后,再加以深入,解释时态和主动被动语态等知识点,就像一个随叫随到的高水平家庭教师。

来源:品牌提供

在语文试题上,学习机现场演示了如何引导完成和《空城计》相关的阅读理解题。这道大题需要孩子分析,在《空城计》的故事里,如果统帅从司马懿换成司马昭,空城计还能成功吗?

学习机的AI学伴也是先启发式提出问题:你能从原文中找出描写司马昭的句子,说说他是个什么样的人吗?那你觉得他仅凭猜测就会去攻城吗?之后,AI学伴又援引三国演义里的相关文段,帮学生更加理解司马昭冲动轻率的个性,从而有理有据地回答这道题。这不仅让孩子学会了眼前这一道题,更学会了今后遇到此类题型的思考路径和解答方法。

来源:品牌提供

在数据方面,来自科大讯飞AI学习机的试点用户调查数据显示,与观看解题视频学习相比,孩子们通过和AI互动“超拟人答疑”后,学习完成率从67%大幅提升至90%,错题解决率也从72%增长至93%。

来源:品牌提供

? 新内容

科大讯飞紧跟2022年新课标“尊重个性、重视自主学习”的要求,联合全国知名院校等权威机构,精心研发了包括AI提优课在内的一系列紧贴新课标的高质量学习内容。

比如说其中的小学数学思维课,先通过AI对孩子进行定级诊断,再根据诊断结果推荐对应课程。在课程中AI会与孩子高频互动,并引导参与。同时,AI还会根据互动结果推荐个性化练习并举一反三,同时配备讲解视频,旨在帮助孩子提高数学思维能力。

? 新学法

除了教学方式和内容上的创新,讯飞AI学习机还围绕新课标、新中考,在学习模式上也再一次升级个性化精准学,逐渐形成了本地化、能分层、全题型、可溯源、多学科以及多模式六大核心优势。

来源:品牌提供

? 新产品

基于全新的AI技术,以及由此带来的新功能、新内容和全新学习方式,讯飞在发布会上重磅推出了新一代非凡旗舰产品——科大讯飞AI学习机T30 Ultra,进一步为孩子们带去更好的学习体验。

来源:品牌提供

在教育领域,人工智能的落地要依托模型强大的能力,更要与传统教学方式深度融合。在星火V4.0的加持下,讯飞AI学习机提供的不仅是优质的学习内容,更是为孩子们打开了一扇门,让每一个孩子都能释放无限潜能。

讯飞在发布会上说,“现在,已经有很多用户在享受通用人工智能时代的红利了”,一旦时间的维度被放大,有无AI辅助的差异会更加明显。作为AI助手,讯飞星火的使命就是要解放生产力、释放想象力,让教育资源能更公平地分配,帮助每一个人成为更好的自己。这也许才是AI最大的意义。

作者:翻翻

-本文包含推广-

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:news@sydneytoday.com

电话: (03)9448 8479

联系邮箱: info@meltoday.com

友情链接: 华人找房 到家 今日支付Umall今日优选