KMIX实验室
发布于 2025-07-11 / 15 阅读
0

2025.7.23 2023-2025年AI发展大事件讲解

2023 - 2025年AI发展大事件讲解

各位同学,大家好!今天我们将深入探讨2023年至2025年期间,人工智能(AI)领域所发生的一系列重大事件。如今,人工智能在各个领域展现出强劲的发展态势,其强大的功能如同一个具备卓越智慧的超级大脑,能够为人类提供广泛且高效的协助,深刻地改变着我们生活的每一个层面。接下来,让我们一同踏入这个充满魅力与无限可能的人工智能世界。


OpenAI 推出的 ChatGPT引爆人工智能圈

OpenAI 推出的 ChatGPT,犹如在科技领域引爆了一枚智能革命的炸弹。它不仅是自然语言处理技术的一次飞跃,更成为了人工智能广泛应用的引擎。通过简单的对话界面,它让复杂的AI技术第一次以亲民的方式走进大众视野。从写作、编程、翻译,到教育、客服、创意构思,ChatGPT 展现出惊人的通用性和实用性,掀起了一股“人人可用AI”的新浪潮。

这不仅仅是一次技术创新,更是一种文化现象的诞生。无论是企业、开发者还是普通用户,都开始重新思考人与智能系统之间的边界。在这个节点上,ChatGPT 不只是一个产品,它成了一个时代的象征——AI 从幕后走到台前,全面引爆了人类与机器协作的新纪元。


国产大模型崛起

2023 - 2025 年国产大模型迅速崛起。2023 年受 ChatGPT 影响,国内大模型呈爆发式增长,“百模大战” 开启,众多企业纷纷入局 。2024 - 2025 年市场洗牌,竞争格局逐渐稳定。字节跳动、阿里、阶跃星辰、智谱 AI 和 DeepSeek 成为 “基模五强”。阿里以开源推动生态发展,智谱 AI 依托学术资源构建全栈产品体系。同时,大模型在技术上不断进步,在多模态融合、性能提升等方面取得成果,还加速渗透到金融、医疗、制造等行业,助力产业智能化升级。

好用的AI 推荐

字节跳动 豆包电脑 手机版

DeepSeek 问小白

大模型从语言大模型变身为多模态

大模型正从语言大模型向多模态大模型转变。以往,语言大模型主要处理文本信息,在图像、音频等其他模态信息的理解和处理上存在局限。

多模态大模型则能融合文本、图像、音频等多种信息。它通过视觉编码器、音频编码器等,将不同模态信息转化为向量,与语言模型实现信息交互与对齐。比如 Meta 的 LLaVA 系列,通过视觉指令调优,把图像特征投影到语言模型嵌入空间,让模型理解图像物体与场景。

多模态大模型应用广泛,可用于图像分类、文档结构识别,还能在教育领域生成图文解题步骤,在广告设计中依文本生成匹配图片。

人机融合与机器人技术的发展

近年来,人机融合与机器人技术发展迅猛,不断刷新人们对未来的想象。央视春晚舞台上,工业机器人化身 “舞美设计师”,它们精准地挥舞着显示屏与灯光设备,配合节目节奏做出多套动作,将传统文化与现代科技完美融合,展现出工业机器人在复杂场景中的出色操控能力 。

全球首个人形机器人半程马拉松开跑,20 支人形机器人赛队与人类选手同场竞技。“天工 Ultra” 以 2 时 40 分 42 秒完赛,成为全球首个完成半马的机器人。此次比赛全方位检验了机器人在运动控制、环境感知和能源管理等核心技术能力 。而央视机器人格斗赛中,机器人凭借出色的稳定性、平衡性和运动驱动算法,上演激烈对抗,展现出强大的软硬件协同性能。

这些精彩呈现背后,是人机融合与机器人技术的持续突破。未来,随着技术不断成熟,机器人有望在更多领域与人类深度融合,进一步改变生活与生产方式。

AI功能演示

https://www.doubao.com/

1、简单问题 直接提问 or 语音对话

2、复杂问题

https://www.bilibili.com/video/BV1ib421E7Sy/?spm_id_from=333.1387.favlist.content.click&vd_source=40c4818b8ab8550f95593822804286f9

3、图片

黄昏中的毁灭瞬间,巨型F5级龙卷风撕裂美国中部小镇,扭曲的风柱连接天地,房屋碎片与汽车残骸在空中翻飞,闪电劈开紫黑色云层照亮雨幕,惊恐的人群在 foreground 泥泞街道上奔逃,采用倾斜的荷兰角构图,超写实细节,暴雨如注,阴森绿调的天空与地面橙红火光形成强烈对比,超高分辨率,暗黑史诗风格。

4、视频

就用刚刚图片

5、名画仿制

用梵高向日葵风格 帮我画一张莲花的作品

6、AI编程

帮我写一个 游戏。 游戏的名字叫做世界名画辨别,你去找10张世界名画的图片 帮我做成网页游戏。 一张一张 出4个选项 我来识别 然后给我一个评分

7、写作 高考作文

阅读下面的材料,根据要求写作。他想要给孩子们喝上一段,可是心里直翻飞腾,开不了口。——老舍《鼓书艺人》假如我是一只鸟,我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》我要以带血的手和你们——拥抱因为一个民族已经起来——穆日《赞美》

以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

8、音乐生成

9、AI播客

7.23-8.4昆明团结乡 AI运动夏令营

1、玩转AI与编程

2、3D打印与建模

3、科学探索与动手实践 

4、运动训练

5、阅读与成长

6、英语交流与人生畅谈

播客投喂资料

## 一、技术突破:从多模态到具身智能的跨越式演进

### (一)生成式AI的“核爆级”升级

1. 多模态融合:在2023 - 2025年,多模态融合技术取得了巨大进展。像OpenAI的GPT - 4o,它可厉害啦,能同时处理文本、图像和语音,就好像一个全能小助手。在GPQA基准测试中,它的得分高达87.7%,在科学推理和编程这些难题上,表现得非常出色。还有谷歌的Gemini 2.0 Flash,它能支持百万token级的上下文输入,这意味着它能处理超级多的信息。Meta的Apollo模型专注于视频生成,Pika 2.0让用户可以自己定义图像生成的逻辑,就像你能指挥一个画家按照你的想法画画一样。

2. 视频生成革命:OpenAI的Sora模型简直像个电影大师,它能生成60秒的电影级视频,而且通过物理引擎,让视频里的光影效果跟现实世界一样真实,这下拍电影可能都要大变样啦。谷歌的Veo 2也不甘示弱,它用强化学习的方法,让视频里人物的肢体动作不再生硬,变得流畅自然。

3. 成本颠覆:百度推出的Wenxin 4.5 Turbo模型,把输入成本大幅降低,每百万tokens只要0.8元,比DeepSeek - V3便宜了60%呢。而且,它靠第三代Kunlun P800芯片,让训练效率提高了一倍,这就意味着更多人能用上强大又便宜的AI技术啦。

### (二)算力竞赛与芯片革命

1. 英伟达B200芯片:英伟达的B200芯片,它的算力比以前提升了50%,能让生成式AI实现实时推理,就是反应特别快。但是它在设计上有点小问题,导致量产得推迟到2025年,这可让全球的算力供应链都跟着发生了变化。

2. 量子计算里程碑:在量子计算方面,谷歌的Willow芯片取得了重大突破,在特定问题上,它比超级计算机快10^18倍,这速度简直难以想象。咱们中国的“九章三号”也实现了量子霸权,纠错能力还提升了50%,这对密码学和药物研发这些重要领域,带来了全新的研究方式。

3. 国产替代加速:华为研发出了“脑云接口”,能把梦境数据存储起来,这是不是很神奇?百度靠着自研的30,000卡AI集群和Kunlun P800芯片,能支持一千多个客户同时对模型进行微调,打破了我们在算力上对国外的依赖。

### (三)人机融合与机器人技术

1. 脑机接口突破:Neuralink在二期临床试验中,让截瘫患者通过自己的意念,就能操控机械外骨骼完成马拉松比赛,这给残疾人带来了新的希望。华为的“脑云接口”还能实现短期记忆的存储,在医疗康复领域,商业化的脚步也越来越快了。

2. 人形机器人量产元年:2023 - 2025年可以说是人形机器人的量产元年。特斯拉的Optimus已经能在工厂里完成搬运、设备检测等20项任务,而且成本降到了2万美元,变得更亲民了。优必选的Walker X在养老院也大显身手,能完成喂食、翻身等护理动作,误差率还低于0.1%,特别精准。

## 二、应用落地:从实验室到产业端的“狂飙突进”

### (一)医疗健康:AI重构诊疗全链条

1. 辅助诊断:腾讯觅影在肺结节识别上非常厉害,灵敏度高达99.2%。有了AI预筛系统,三甲医院影像科的人力成本降低了40%,医生们看病的效率大大提高啦。

2. AI制药:AlphaFold 3把蛋白质结构预测的时间,从几个月缩短到了小时级别,这大大加快了新药研发的速度。药明康德的AI平台更是把新药研发周期压缩到了8年,成本降低了35%,以后我们能更快用上新药啦。

### (二)制造业:全流程智能化升级

1. 智能质检:工业富联的AI视觉系统特别精准,漏检率低于0.001%。富士康深圳工厂用了这个系统,质检效率提高了20倍,生产出来的产品质量更有保障了。

2. 预测性维护:三一重工通过AI算法,能提前7天就知道设备可能会出故障,这样就能提前准备,减少了60%的非计划停机,一年下来维护成本下降了2.3亿元,为企业节省了好多钱呢。

### (三)消费电子:AI硬件的“黄金时代”

1. AI手机与PC:苹果的Apple Intelligence和iOS系统深度结合,在手机上就能实现“一句话修图”“实时会议纪要生成”这些超酷的功能。华为Mate 70搭载了盘古大模型,在手机端进行推理的延迟低于50ms,反应特别快。到2025年,预计AI手机的渗透率能达到54%,以后我们的手机会越来越智能。

2. AI眼镜爆发:小米的AI眼镜能实时翻译、进行AR导航,就像一个随时在身边的小秘书。中国联通的eSIM运动眼镜一个月就能卖出10万台,成为了新一代的交互方式,以后我们获取信息会更方便。

### (四)自动驾驶:L4级规模化普及

1. 商业闭环:百度的“萝卜快跑”在武汉,无人驾驶出租车每天能接超过20万次订单,已经形成了商业运营模式。蘑菇车联通过车路协同技术,把事故率降低了90%,让出行变得更安全。

2. 成本下探:特斯拉的FSD V12把硬件成本压缩到了1500美元,这样L4级自动驾驶系统就能成为20万元车型的标配,以后更多人能体验到自动驾驶的便利啦。

## 三、产业生态:系统级AI与“千业万模”的崛起

### (一)从单点模型到系统级智能

1. 多模型协作:联想的AI Force平台集成了20多个大模型,通过RAG技术,能调用企业自己的知识库。这让智能体不再只是简单回答问题,而是能像个业务决策者一样,帮企业解决复杂问题。

2. 行业专用模型:在金融领域,DeepSeek - R1模型在风险评估任务中的准确率提高了18%,能更好地帮助银行等金融机构判断风险。在制造业,腾讯云TI平台让生产排程优化效率提升了40%,工厂生产更合理、更高效。

### (二)开源生态与技术平权

1. DeepSeek开源冲击:DeepSeek的稀疏算法和MoE架构,让模型推理成本降低了70%。这么大的优势,吸引了英伟达、亚马逊等大公司都接入它的技术,一下子把全球AI开发的门槛降低了,更多人能参与到AI开发中来。

2. 国产替代加速:阿里云、华为云全力支持国产大模型的部署,中国企业采购AI解决方案的成本,比2023年下降了55%,这让我们国内的企业能更轻松地用上国产的AI技术,推动国内AI产业发展。

### (三)智能体(Agent)的爆发

1. 企业级应用:IBM的Watsonx Orchestrate平台可强大了,能把80多个核心业务系统集成在一起,还能支持3000个并发请求。在供应链管理中,它能把决策时间从小时级缩短到分钟级,大大提高了企业的运营效率。

2. 人机协作范式:Gartner预测,到2025年,15%的日常工作决策会由AI自主完成。不过在医疗这些对安全要求特别高的领域,还是需要人来把关,确保安全。

## 四、未来挑战:伦理、能源与治理的三重博弈

### (一)伦理困境

1. 版权争议:在英国,因为AI版权豁免政策,引发了创作者罢工。Adobe Firefly 3也被指责非法使用训练数据,关于AI版权的诉讼案件增加了300%,我们得好好想想怎么保护创作者的权益。

2. 就业冲击:在法国,因为AI可能替代50%的基础岗位,引发了全国罢工。全球工会联盟要求企业缴纳“自动化税”,我们要思考如何在发展AI的同时,保障人们的就业。

### (二)能源危机

像训练GPT - 5这样的大模型,需要消耗6000MWh的电力,这相当于6万户家庭一年的用电量,太惊人了。微软都计划建设核能数据中心,来解决AI发展带来的能源问题。

### (三)全球治理框架

1. 欧盟AI法案:欧盟把AI系统分成“不可接受风险”到“低风险”四类,要求高风险的AI系统,在整个生命周期都能被追溯,这样能更好地管理AI的风险。

2. 中国“人工智能 +”行动:中国推动制造、交通等10大领域的智能化改造,但在数据跨境流动方面的限制,让跨国公司在合规上遇到了一些问题,我们需要找到平衡发展和监管的方法。

同学们,2023 - 2025年,AI技术发展特别快,从实验室走进了我们生活的各个角落,成为了强大的生产力。但同时,也带来了算力、伦理、能源这些挑战。就像IBM的翟峰说的:“AI智能体的未来不是取代人类,而是重塑人机协作的边界”。我们要构建“创新 - 伦理 - 商业”三位一体的发展模式,让AI技术真正为人类带来好处。

关于未来,我们也有一些预测。到2026年,量子计算可能会破解RSA - 2048加密算法,这会让全球的数据安全体系发生大变化。脑机接口在医疗市场的规模,到2027年可能达到千亿美元,不过意识上传技术还存在哲学上的争议。也许在2026年,AI治理联盟(AGF)会成立,推动全球AI伦理标准统一。

希望同学们通过了解这些AI大事件,对这个神奇的领域产生更多兴趣,以后也能为AI的发展贡献自己的力量!

如果你对其中某个事件想深入了解,或是希望我再补充其他方面的内容,都能随时跟我说,我会进一步完善这份讲稿。