AI科技前沿:人形机器人、开源模型与智能设备新突破

2

近期,科技领域迎来多项重大突破,从仿生人形机器人到开源AI模型,从生命科学专用AI系统到消费电子产品升级,技术创新正以前所未有的速度推进。这些进展不仅展示了科技公司的研发实力,也预示着未来生活方式的潜在变革。

宇树科技H2仿生人形机器人:更接近人类的形态与功能

宇树科技正式发布了其新一代仿生人形机器人Unitree H2,标志着国产人形机器人技术迈上新台阶。这款机器人身高180厘米,体重70公斤,整体外形设计更加贴近人类真实形态,官方发布的视频中,H2还被穿上了衣服,进一步增强了其拟人化的外观效果。

null

在硬件配置上,Unitree H2配备了31个关节,具体分布为肩部6×2(双臂各6个)、躯干3个、腿部7×2(双腿各7个),另含2个未知功能关节。相比宇树科技此前发布的R1机型的26个关节,关节数量提升19%,灵活性显著增强。从视频演示中可以看出,H2在灵活性和稳定性方面有了显著提升,能够轻松完成舞蹈和武术展示,动作流畅自然,各个关节的活动也十分丝滑,展现出较高的运动性能和协调性。

最引人注目的是,Unitree H2在H1的基础上增加了仿生人脸,这一改进使其在外观和功能上都更接近科幻电影中描绘的机器人形象。仿生人脸的加入不仅提升了机器人的外观拟人度,也为未来的人机交互提供了更多可能性,如表情识别和情感反馈等。

DeepSeek-OCR:视觉模态压缩长文本上下文的新方法

DeepSeek-AI团队发布了《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。该模型参数量为3B,由核心编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M两部分组成。

null

DeepEncoder专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉token数量在可管理的范围内。实验显示,当文本token数量不超过视觉token的10倍(压缩比低于10×)时,模型的OCR精度可达97%;即便压缩比提高到20×,准确率仍保持约60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。

在OmniDocBench测试中,DeepSeek-OCR使用100个视觉token就超过了GOT-OCR2.0(每页256个token),而使用不到800个视觉token便优于MinerU2.0(平均每页超过6000个token)。这种高效的压缩能力使其在实际生产中表现出色,可在单块A100-40G显卡上每天生成超过20万页的大语言模型/视觉语言模型训练数据。

Anthropic推出面向生命科学领域的Claude系统

Anthropic公司发布了"Claude生命科学版",旨在推动人工智能在生物技术领域中的应用。与一些AI公司扩展业务到情感陪伴和成人内容等领域不同,Anthropic展示了人工智能在科学研究和医疗健康方向上的更集中的努力。

null

据Anthropic介绍,最新的Claude Sonnet 4.5模型在生命科学领域的表现远胜以往版本,并且在关键测试标准上已能媲美人类专家。Claude还深度集成了多种生命科学研究常用工具,包括Benchling实验室数据管理、PubMed生物医学文献检索、BioRender科学图表绘制和10x Genomics单细胞分析系统。

Anthropic展示了其新发布的Claude Skills功能如何将可重复的科学流程转化为AI自动化工作流。例如,公司开发了一个用于单细胞RNA测序数据自动质量控制的新技能,可显著提升数据处理效率。为帮助用户快速上手,Anthropic还推出了针对生命科学领域的提示库,覆盖文献综述、假设生成、实验流程起草、基因组数据分析和法规文件准备等常见场景。

目前,Anthropic已与多家大型制药及生物技术公司如Sanofi、AbbVie、10x Genomics和Novo Nordisk开展合作,这些公司反馈使用Claude后,临床文档编制时间大幅缩短,且普通研究人员也能更容易访问复杂数据分析结果。Claude生命科学版已通过Claude和AWS Marketplace提供,未来还将支持Google Cloud Marketplace。

消费电子领域的创新进展

苹果将在中国大陆推出eSIM快速转换功能

苹果无线软件技术与生态系统副总裁Arun Mathias及无线技术团队的Anjali Jotwani在接受采访时透露,未来苹果将会在中国大陆推出eSIM快速转换功能(eSIM Quick Transfer)。这意味着国行iPhone Air用户在设备端激活eSIM后,后续切换设备可以通过该功能把eSIM换到新设备上,无需再跑一趟营业厅,大大提升了用户体验。

华为Mate 80系列及二合一平板电脑即将发布

博主@数码闲聊站爆料了一款代号Voyager的新机,目前有黑/白/青绿三种颜色,M80全系备案11月,可能是华为Mate 80系列标准版。同期备案的还有一个"二合一平板电脑",代号Qianxuesen,有皓月银/深空灰两种颜色,是打通鸿蒙多端生态融合的新设备。

null

爆料还显示,华为Mate 80系列将包括两个主要版本,分别为代号Voyager和Sagittarius的标准版和Pro版,这两个版本在充电配置上有所区别:标准版将配备66W有线充电技术,Pro系列将采用100W有线充电技术。Mate 80 Pro系列样机备案颜色丰富,AL00系列包含黑、白、金、青四种配色,AL10系列则是黑、白、金、紫、青、银六种配色,还将提供素皮保护壳+磁吸支架保护壳,支持磁吸生态。

iOS 26.1 Beta 4发布:新增多项个性化功能

苹果在最新推送的iOS 26.1、iPadOS 26.1及macOS 26.1第四测试版中,针对系统个性化体验带来了多项备受关注的新功能。系统设置中新增了"Liquid Glass透明度调节"开关,用户可选择更透明的"清晰"风格或更高对比度的"加深"风格,让按钮、菜单等系统元素更加突出,调节内容覆盖操作系统各处,包含App内及锁屏通知。

null

此外,苹果首次允许关闭"锁屏左滑唤起相机"功能。在iOS 26.1 Beta 4的"设置-相机"分区,新增了"锁屏滑动打开相机"开关。关闭后,即可彻底禁用锁屏左滑唤出的相机,避免因误操作或手机被他人拿到时随意拍照,兼顾个人隐私与安全。本次测试版还加入了多语言Apple Intelligence助手、新的闹钟与计时器"滑动停止"机制、新的Apple TV应用图标,以及Settings应用界面优化等众多细节变化。

小度AI眼镜即将上市:AI技术与可穿戴设备的融合

据《科创板日报》报道,百度旗下的小度AI眼镜将在11月举行百度世界2025大会上正式推出,计划于今年年内开售。该产品被描述为"全球首款搭载中文大模型的原生AI眼镜",具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。

null

在硬件配置方面,小度AI眼镜重量仅为45克,搭载16MP超广角摄像头,支持AI防抖算法;标称待机续航56小时,支持超5小时连续聆听,可30分钟充满电;采用四麦克风阵列识别声音,并使用开放式防漏音扬声器设计。这些配置使其在保证功能强大的同时,也兼顾了佩戴舒适性和便携性。

小度AI眼镜的推出代表了AI技术与可穿戴设备融合的新趋势,将大模型的能力融入到日常佩戴的眼镜中,为用户提供随时随地的智能助手服务。这种形态的AI设备可能会成为继智能手机之后的下一个主流计算平台,开启人机交互的新篇章。

AI在金融领域的应用:加密交易竞赛展示模型能力差异

专注于金融市场的人工智能研究实验室nof1于10月18日开始一项大模型交易测试Alpha Arena。该测试使用6个主流AI大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在Hyperliquid上获得10,000美元的真实资金,并具有相同的提示和输入数据。

截止发稿时,DeepSeek和Grok收益率均超14%,排名前二,而Gemini 2.5 Pro则已亏损42.57%。这一结果不仅展示了不同AI模型在金融交易领域的表现差异,也反映了AI在复杂决策场景中的应用潜力。值得注意的是,来自中国的DeepSeek模型在这项测试中表现突出,与Grok并驾齐驱,显示了中国AI技术在特定应用场景中的竞争力。

总结与展望

从近期科技领域的多项重大进展可以看出,AI技术正在向更专业化、更实用化的方向发展。无论是仿生人形机器人的形态与功能进化,还是针对特定领域(如生命科学)的专用AI系统开发,都显示出AI技术正从通用型向专用型、从实验室向实际应用场景转变。

同时,消费电子产品的创新也在加速,eSIM技术的普及、折叠屏和二合一设备的成熟、操作系统的个性化定制等,都在不断改善用户体验。AI技术与可穿戴设备的融合,如小度AI眼镜,则预示着未来人机交互的新可能。

在金融等复杂应用场景中,不同AI模型的表现差异也提示我们,AI技术的发展仍面临诸多挑战,需要在算法优化、数据质量、场景适配等方面持续投入。随着技术的不断进步和应用场景的拓展,我们有理由相信,AI将在更多领域发挥重要作用,推动社会生产力的进一步提升。