AI 资讯

每日聚合最新人工智能动态

全部 🔥 精选 🆕 新上线 🔄 更新

来源：IEEE AI清除筛选 ×

101

视频星期五：极致全向移动机器人

新上线

本周的机器人视频精选又来了！从仿生多足设计到全向移动突破，这些机器人正在重新定义“运动能力”的边界。 ## 亮点一：多足机器人的“冗余美学” 在最新一期“视频星期五”中，**通用机器人实验室（General Robotics Lab）** 展示了一款拥有**超常数量腿**的机器人。设计师似乎信奉“腿越多越好”的理念——这款机器人不仅能在复杂地形中保持稳定，还能通过冗余腿实现**容错运动**：即使部分关节失效，仍能继续完成任务。这让人联想到自然界中的蜈蚣或千足虫，它们通过多足协调实现高效且稳健的移动。 ## 亮点二：极致全向移动能力该机器人的**全向移动**能力尤为突出。不同于传统轮式或双足机器人的转向限制，它可以在不改变朝向的情况下向任意方向平移，甚至原地旋转。这种能力在狭小空间作业（如管道检测、废墟搜救）中极具价值。研究者通过优化腿部运动轨迹和地面接触力，实现了近乎瞬时的方向切换。 ## 行业背景：为什么“腿越多”反而更受关注？近年来，足式机器人领域呈现两极分化：一方面，**双足人形机器人**因拟人形态备受资本追捧；另一方面，**多足机器人**在**工业巡检、灾害响应**等场景中展现出独特优势。例如，波士顿动力的Spot（四足）已在石油平台和建筑工地部署，而六足或八足机器人则能进一步降低单腿负载，适应更松软或崎岖的地形。 ## 未来展望虽然该机器人目前仍处于实验室阶段，但其设计理念为下一代救援或探索机器人提供了新思路。随着驱动器和控制算法的进步，多足机器人有望在**农业、行星探测**等领域大显身手。不过，能耗和运动效率仍是需要攻克的关键难题。更多机器人酷炫视频，可关注IEEE Spectrum的“视频星期五”系列。

IEEE AI1个月前原文

102

用微流控技术打造柔软的数码时钟：空气驱动的硅胶显示

新上线

## 当时间以“软”姿态流动传统数码时钟的显示方式，要么是LED数字的冷光，要么是LCD屏幕的像素矩阵。但一位来自柏林的生物物理学家、硬件创业者兼YouTuber **Nils Janßen** 带来了截然不同的方案：一款由硅胶制成、完全依靠空气驱动的软性数码时钟。其背后的核心技术是**毫流体逻辑与记忆**（millifluidic logic and memory），让时间显示以一种近乎“活”的柔软质感呈现。 ### 从微流控到毫流控：逻辑的物理化微流控技术通常用于生物芯片，通过微小通道操控液滴进行生化反应。而Janßen将其尺度放大到“毫”级别（通道宽度约毫米级），并改用空气作为工作介质。核心思路是：用气压代替电压，用柔性硅胶通道代替刚性电路，构建出**与电子逻辑门（AND、OR、NOT）功能等同的纯气动逻辑门**。在电子时钟中，秒信号通过分频电路驱动分钟和小时计数。在Janßen的软时钟里，空气脉冲沿着硅胶迷宫般的通道传播，经过一系列气动“触发器”和“计数器”模块，最终驱动对应数字的软性指示器。每个数字由7段软管组成，当气动信号到达某段时，该段会膨胀变色（通常从透明变为白色或彩色），形成可读的数字。 ### 制造工艺：硅胶与3D打印的结合实现这样的系统需要精密的制造工艺。Janßen采用**多层硅胶浇铸与3D打印模具**相结合的方式： - 首先，用3D打印制作出带有通道网络的正模。 - 然后，将液态硅胶倒入模具，固化后形成带有空腔的柔性基板。 - 最后，通过键合工艺将多层硅胶片叠压在一起，形成三维气路网络。这种工艺与电子PCB制造有异曲同工之妙，只不过“导线”是空气通道，“元件”是气动阀。由于硅胶本身具有弹性，通道在气压下可以像气球一样膨胀，从而实现“开/关”两种状态。 ### 应用场景与行业意义这款软时钟目前仍属于DIY原型，但其意义远超一个新奇玩具。它展示了**柔性、可穿戴或生物兼容设备**的一种全新交互范式： - **医疗领域**：软体机器人、可穿戴给药装置或许可以利用类似气动逻辑，在无电环境下执行简单控制。 - **教育工具**：气动逻辑门可以直观演示计算机原理，无需焊接或编程。 - **艺术与设计**：动态变形的软材料显示为交互艺术提供了新的表达媒介。当然，气动逻辑的局限性也很明显：速度慢（秒级响应）、能耗高（需要持续供气）、集成度低（无法与CMOS工艺竞争）。但正如Janßen所言，他追求的不是性能，而是“让计算变得可触摸、可变形”。 ### 结语在AI硬件普遍追求更小、更快、更冷的趋势下，这款“慢吞吞”的软时钟反而提供了一种逆向思考：**计算不一定非要在硅基芯片中完成，也可以在柔软、有温度的硅胶管道里，以空气的流动来度量时间。** 或许未来的人机界面，会有一块区域留给这种“软逻辑”，让技术与生命体之间不再有冰冷的边界。

IEEE AI1个月前原文

103

精准农业技术能否化解化肥短缺危机？

新上线

霍尔木兹海峡的紧张局势导致化肥价格大幅飙升，全球农业面临严峻挑战。在这一背景下，精准农业技术——尤其是土壤传感器和数据分析工具——正成为缓解化肥短缺、提升施肥效率的关键手段。 ## 危机背景：化肥价格为何飙升？霍尔木兹海峡是全球最重要的石油和天然气运输通道之一，而天然气是生产氮肥的主要原料。地缘政治紧张导致天然气价格波动，直接推高了化肥生产成本。此外，供应链中断和出口限制进一步加剧了化肥供应短缺，使得农民面临成本激增和肥料可及性下降的双重压力。 ## 精准农业的应对方案精准农业技术通过实时监测土壤养分、水分和其他关键指标，帮助农民实现“按需施肥”，从而减少浪费、提高效率。以 **Stenon** 公司的田间土壤传感器为例，该设备结合**光学和电化学测量**，能够在现场快速分析土壤状况，提供关于氮、磷、钾等关键养分的精确数据。这种即时诊断能力使农民可以根据实际需求调整施肥方案，避免过量或不足。 ### 技术优势 - **减少浪费**：传统施肥往往采用“一刀切”方式，导致部分区域养分过剩而其他区域不足。精准传感器可以识别土壤异质性，实现变量施肥。 - **降低成本**：在化肥价格高企时，精准施用能显著减少投入。据估算，采用变量施肥技术可节省**10%至30%** 的化肥用量。 - **环境友好**：减少化肥流失可降低对水体的污染，并减少温室气体排放（如一氧化二氮）。 ## 行业现状与挑战尽管精准农业技术潜力巨大，但其推广仍面临障碍： 1. **成本门槛**：高端传感器和数据分析系统初期投资较高，中小农户可能难以承受。 2. **技术集成**：需要将传感器数据与农机、卫星影像、气象数据等整合，形成完整的决策支持系统。 3. **数据解读能力**：农民需要培训才能有效利用传感器提供的信息，否则技术可能“水土不服”。 ## 未来展望化肥短缺危机正在加速精准农业技术的采用。随着传感器成本下降和人工智能分析工具的普及，更多农民有望受益。此外，政策激励（如补贴或技术支持）也将推动这一转型。 **小结**：精准农业不是万能药，但在当前化肥供应紧张、价格高企的背景下，它提供了一条切实可行的减量增效路径。从田间传感器到智能施肥设备，技术正在帮助农业在不确定的环境中保持韧性。

IEEE AI1个月前原文

104

芯片设计师如何在产业界取得成功？学术界与工业界的思维差异

新上线

## 从学术到产业：芯片设计师的转型之路对于许多从事芯片设计的工程师来说，从学术界转向产业界是一次关键的职业转型。IEEE Fellow、现任Silicon Creations高级设计架构师的**Maysam Ghovanloo**，在职业生涯中先后经历了学术研究和工业实践两个阶段，他的经验揭示了两者在方法论和思维方式上的显著差异。 ### 学术与产业：不同的成功标准在学术界，芯片设计师通常追求**创新性**和**论文发表**。研究项目往往以探索未知领域、提出新架构或优化算法为目标，评价标准是学术影响力。而产业界更看重**可靠性、成本效益和上市时间**。芯片产品必须满足严格的功耗、性能和面积（PPA）指标，并能在量产中保持一致性。 Ghovanloo指出，学术研究中的“成功”往往是一次性的原型验证，而工业设计则需要面对**大规模生产、良率控制、供应链管理**等现实挑战。例如，一个在实验室中表现优异的电路设计，可能因为工艺偏差或温度变化而在批量生产中出现问题。 ### 关键技能：从理论到实践从学术研究转向工业设计，需要培养以下几项关键能力： - **设计可制造性**：理解工艺限制，确保设计能通过晶圆厂的制造流程。 - **团队协作与沟通**：与封装、测试、产品工程等团队密切配合。 - **时间管理与优先级**：在紧迫的交付周期中做出权衡。 - **系统思维**：不能仅关注单一模块，而要考虑芯片整体架构。 Ghovanloo强调，许多学术背景的工程师在进入产业后，容易过度追求“完美设计”，但产业界更要求“足够好且及时”。 ### 行业趋势：AI与异构集成当前芯片设计行业正面临两大趋势：一是**AI加速器**需求激增，推动定制化芯片（如ASIC）设计复杂化；二是**异构集成**（如Chiplet）技术兴起，要求设计师掌握跨领域知识。Ghovanloo建议，有志于产业界的芯片设计师应主动学习**数字与模拟混合设计**、**先进封装**以及**EDA工具优化**等技能。 ### 小结芯片设计领域的职业路径并非单一。无论是留在学术界深耕前沿研究，还是转入产业界推动产品落地，都需要明确自身优势与目标。Ghovanloo的经历表明，理解两种环境的不同节奏与评价体系，是成功转型的第一步。

IEEE AI1个月前原文

105

无结晶体管开辟3D芯片新路径：纳米膜“卷对卷”堆叠三层硅电路

新上线

半导体行业正面临传统晶体管微缩的物理极限，而3D芯片被视为延续摩尔定律的关键方向。然而，传统3D集成工艺复杂、成本高昂。近日，伊利诺伊大学厄巴纳-香槟分校（UIUC）曹青教授团队在《自然》杂志发表研究，提出一种基于**无结晶体管**的颠覆性方案，利用“卷对卷”纳米膜技术，在**三层硅层**上构建出可工作的电路，为低成本、高性能3D芯片开辟全新路径。 ### 什么是无结晶体管？传统晶体管依赖源极和漏极之间的**PN结**（正-负半导体界面）来控制电流，制造过程涉及高精度掺杂和多次高温退火，工艺复杂且对3D堆叠中的下层电路产生热应力。无结晶体管则完全摒弃PN结，使用单一掺杂类型的硅纳米线或纳米膜，通过改变栅极电压调节沟道电阻来开关电流。这种结构天然简化了制造流程，且对热预算更友好，尤其适合多层堆叠。 ### 关键创新：纳米膜“卷对卷”转移团队的核心突破在于**纳米膜转移技术**。他们先在绝缘衬底上生长高质量的单晶硅纳米膜（厚度仅几纳米），然后像“卷保鲜膜”一样将薄膜剥离并转移到目标硅层上。通过重复这一过程，团队成功在**三层硅层**上分别制造了无结晶体管，并实现了层间互连，构建出完整的逻辑电路。与传统的硅通孔（TSV）或外延生长方法相比，这种技术无需高温处理，避免了层间热损伤；同时，纳米膜可以预先在最优条件下制备，再转移至任意衬底，打破了单晶硅必须与衬底晶格匹配的限制。 ### 性能与潜力测试显示，三层堆叠的无结晶体管在开关比、亚阈值摆幅等关键指标上接近单层器件的水平，且层间互连电阻可控。尽管当前演示的电路规模较小（仅包含几十个晶体管），但该技术展示了**可扩展性**：理论上可以堆叠更多层数，且每层可独立优化材料与掺杂。这一成果的意义在于： - **降低3D芯片制造成本**：无需昂贵的极紫外光刻（EUV）或多层对准工艺，利用现有成熟的薄膜沉积和剥离设备即可实现。 - **提升集成密度**：垂直方向堆叠可绕过传统光刻的线宽限制，在相同芯片面积上容纳更多晶体管。 - **兼容异构集成**：不同功能的材料（如硅、锗、化合物半导体）可以分别制备后转移到同一芯片的不同层，实现“材料按需分配”。 ### 挑战与展望目前该技术仍处于实验室阶段，主要挑战包括： 1. **大面积均匀性**：纳米膜转移过程易产生褶皱或裂纹，需要优化转移工艺以支持晶圆级生产。 2. **层间对准精度**：多层堆叠要求纳米级对准，当前手动操作精度不足，需开发自动对准工具。 3. **热管理**：多层电路发热集中，无结晶体管的散热设计需进一步研究。尽管如此，UIUC团队的工作为3D芯片提供了一条“非主流”但极具潜力的技术路线。如果说传统3D集成是“搭积木”，那么无结晶体管加纳米膜转移更像是“摊煎饼”——逐层摊开、层层叠加。这种思路或许能让3D芯片从高端实验室走向大规模量产，为AI加速器、存算一体芯片和高密度存储器带来新的可能。 ### 小结无结晶体管与纳米膜转移技术的结合，跳出了传统CMOS微缩的思维定势，用“减法”简化了工艺，用“加法”拓展了维度。尽管距离商业化还需数年，但它为后摩尔时代的芯片设计提供了一个值得关注的新方向。

IEEE AI1个月前原文

106

南非手握AI筹码，但草案政策却未善加利用

新上线

南非正站在一个独特的历史节点上：作为全球矿产资源大国，它握有影响人工智能未来发展的关键筹码，但最新发布的AI政策草案却未能有效转化这一优势。本文剖析南非AI政策现状与机遇。 ## 资源优势为何重要？ AI的底层驱动力是算力，而算力离不开芯片制造所需的稀有矿产。南非拥有全球最大的铂族金属储量，以及大量钴、锰等关键矿物，这些正是高性能芯片生产不可或缺的原材料。这意味着，在国际AI供应链中，南非并非旁观者，而是拥有实质性议价能力的参与者。然而，南非政府近期成立的AI政策小组所发布的第一份政策草案，却几乎未提及如何利用矿产资源来增强本国在AI领域的战略地位。草案更多聚焦于伦理框架、技能培训等传统议题，对产业经济杠杆的考量明显不足。 ## 错失的机遇与潜在风险政策制定者似乎忽略了两个关键点： 1. **资源换技术**：其他资源国已在尝试通过出口管制或合作投资，换取AI技术转移与本地算力基础设施建设。南非若仅满足于原料出口，将重蹈“资源诅咒”覆辙——卖矿石赚微利，而高附加值环节全在海外。 2. **能源与算力结合**：南非拥有丰富的太阳能与风能资源，可支撑低成本的绿色数据中心。将“清洁能源+关键矿产”打包作为AI产业基地的吸引力，远比单一政策框架更具说服力。 ## 非洲AI发展的标杆责任作为非洲大陆工业化程度最高的经济体之一，南非的AI政策具有示范效应。若草案不能展现前瞻性，可能使整个非洲在AI全球分工中继续处于价值链底端。一个好的AI政策不应只是伦理清单，而应是一份产业战略。南非完全有条件成为“资源-算力-应用”闭环的先行者，关键在于政策制定者能否跳出传统思维，将资源优势真正转化为AI竞争中的结构性力量。目前草案尚处于征求意见阶段，修改窗口依然存在。国际社会正密切关注：南非是会选择被动跟随，还是主动利用筹码重塑规则？

IEEE AI1个月前原文

107

让电动重卡真正实用的幕后软件

新上线

电动化浪潮正席卷全球交通运输业，但重型卡车（重卡）的电动化转型面临独特挑战：续航里程有限、充电基础设施不足、运营成本高昂。瑞典公司 Einride 正试图通过一套“全栈式”软件方案破解这一难题。 ### 从硬件到软件：Einride 的差异化路径自 2019 年起，Einride 的无人驾驶、无驾驶舱电动卡车已在瑞典公共道路上运营。然而，真正让 Einride 与众不同的并非其炫酷的硬件设计，而是其**专为电动化而生的软件平台**。与传统车企将电动化视为“油改电”不同，Einride 从零开始构建了一套**电动优先（electric-first）的软件生态**，涵盖路线规划、充电调度、车队管理和自动驾驶控制。 ### 核心挑战：电动重卡的“里程焦虑” 重卡电动化的最大瓶颈在于**电池重量与续航的矛盾**。一辆满载 40 吨的重卡若配备足够续航的电池，电池本身可能重达数吨，进一步压缩有效载荷。Einride 的软件通过**动态负载管理**和**智能路线优化**，在保证运输效率的前提下，将电池容量控制在合理范围。其算法会实时分析地形、交通、天气和充电站状态，规划出能量消耗最优的路径，甚至利用下坡路段进行能量回收。 ### 软件如何“盘活”充电基础设施充电设施的稀缺是另一个痛点。Einride 的**充电调度系统**并非简单匹配充电桩，而是**将充电行为融入物流时间表**。系统会预测每辆车的充电需求，并自动预约充电时段，避免排队等待。更关键的是，它支持**“充电即服务”**模式——车队无需自建充电站，而是通过 Einride 的合作伙伴网络按需充电，大幅降低前期投资。 ### 自动驾驶与能源管理的融合 Einride 的软件还将自动驾驶能力与能源管理深度结合。其自动驾驶系统不仅关注安全，更注重**能耗优化**：通过平稳加速、提前减速和编队行驶（platooning），可将能耗降低 15%-20%。此外，软件会**根据电池健康状态动态调整驾驶策略**，延长电池寿命。 ### 行业影响：从“硬件竞赛”转向“软件定义” Einride 的案例表明，电动重卡的竞争正从硬件参数转向**软件定义的系统集成能力**。传统车企如戴姆勒、特斯拉专注于电池和电机性能，而 Einride 则证明：**更聪明的软件能让现有电池技术发挥更大价值**。这种“软件优先”的思路，可能加速整个物流行业的绿色转型。 ### 小结电动重卡要真正“实用”，不能仅靠更好的电池，更需要一套**懂物流、懂能源、懂路况的智能软件**。Einride 的实践为行业提供了重要参考：当软件成为基础设施，电动化才能从“可行”走向“高效”。

IEEE AI1个月前原文

108

DNA合成技术突破：Sidewinder大幅缩短基因序列构建时间

新上线

## 从AI预测到真实合成：DNA合成迎来效率革命在人工智能驱动的生物技术领域，一个长期存在的瓶颈正在被打破。AI模型可以快速预测和设计全新的基因序列，但将这些数字设计转化为物理DNA分子却是一个缓慢且昂贵的过程。如今，一家名为**Sidewinder**的公司推出了一项颠覆性的DNA合成技术，大幅缩短了构建新基因序列所需的时间，使得AI预测的基因序列能够更快速地投入实际应用。 ### 技术突破：速度与可及性的双重提升传统的DNA合成方法依赖于化学合成，通常需要数天甚至数周才能完成一个中等长度的基因序列。Sidewinder的新技术通过优化酶促合成过程，将时间压缩至**数小时**级别。这不仅加快了研究进度，还降低了成本，使得更多实验室和企业能够负担得起定制基因序列的生产。这一突破的关键在于Sidewinder开发的新型酶和反应体系，能够在更短的时间内精确地添加核苷酸，同时保持极高的准确性。与现有技术相比，Sidewinder的合成错误率更低，尤其适用于长链DNA的合成，这正是许多AI模型设计的目标序列的特点。 ### 行业背景：AI与合成生物学的融合近年来，AI在蛋白质设计、基因电路构建和代谢工程等领域展现出巨大潜力。例如，DeepMind的AlphaFold可以预测蛋白质结构，而生成式AI模型如**ProGen**和**RFdiffusion**能够设计全新的功能性蛋白。然而，这些设计最终都需要通过DNA合成来实现。Sidewinder的技术恰好填补了从数字设计到物理实现的鸿沟。 **合成生物学**市场正在快速增长，据预测到2028年将达到数百亿美元规模。DNA合成作为核心底层技术，其效率的提升将直接推动基因治疗、疫苗开发、生物材料制造等领域的发展。Sidewinder的突破可能加速个性化医疗、可持续生物制造等前沿应用的落地。 ### 实际应用与未来展望 Sidewinder的技术目前已在多个合作项目中得到验证。例如，研究人员利用该技术快速合成了AI设计的**CRISPR基因编辑组件**，用于更精准的基因治疗。此外，在**酶工程**领域，Sidewinder帮助团队在几天内构建了数百个候选基因变异体，大幅缩短了筛选周期。尽管Sidewinder尚未公布具体的商业化时间表，但这一技术已经引起了生物技术界的广泛关注。如果能够大规模推广，它将改变合成生物学的研究范式：研究人员不再受限于合成速度，可以更自由地探索AI设计的复杂序列。 ### 小结：效率即生产力 Sidewinder的突破提醒我们，在AI时代，计算能力的提升需要与实验技术的进步同步。DNA合成速度的提升，不仅意味着更快的实验周期，更意味着AI模型能够更快速地迭代——设计、合成、测试的循环可以更高效地运转。对于合成生物学而言，这或许是一个新的起点。

IEEE AI1个月前原文

109

拯救软盘：保存介质知识比数据本身更珍贵

新上线

在云存储和固态硬盘主导的今天，软盘几乎成了古董。但全球各地的档案馆、图书馆和私人收藏中，仍有大量珍贵数据封存在这些脆弱的磁性介质里。如何读取并长期保存这些信息，正在成为数字文化遗产保护领域的一大挑战。剑桥大学图书馆的Leontien Talboom领导了一项为期一年的项目，旨在制定更好的软盘数据访问与保存指南。在接受IEEE Spectrum采访时，Talboom强调：**关于介质本身的知识，与磁盘上的内容同样重要**。 ## 软盘保存的核心难点软盘保存面临多重障碍。首先，**硬件正在消亡**——能够正常工作的软盘驱动器越来越少，接口（如34针软驱排线）也逐渐被现代电脑抛弃。即使找到驱动器，磁头校准、电机老化等问题也可能导致读取失败。其次，**介质自身会退化**。软盘的磁性涂层会随时间消磁，霉菌、潮湿和物理划痕都可能导致数据无法恢复。Talboom指出，许多看似完好的磁盘，内部可能已经出现不可逆的损伤。 ## 知识即基础设施 Talboom的项目发现，保存软盘的关键不仅是提取数据，更是**记录读取过程中的技术细节**：驱动器型号、读取软件版本、转速设置、错误率等。这些元数据决定了未来能否复现读取过程。例如，某些老式磁盘使用非标准格式化参数，只有特定驱动器和软件组合才能正确读取。项目产出的指南建议： - **优先创建磁盘的原始位镜像**（bit-for-bit image），而非直接复制文件 - **记录完整的硬件与软件环境**，包括驱动器控制器、操作系统版本和读取工具 - **对严重退化的磁盘采用多次读取、投票纠错**的策略 ## 行业背景与启示随着“数字黑暗时代”的隐忧浮现，软盘保存只是更大范围数字遗产保护的一个缩影。从5.25英寸到3.5英寸，从单面到双面高密，软盘格式繁多，且常与专有软件绑定。Talboom的工作提醒我们：**数字保存的本质是保存“解读能力”**——不仅需要数据，还需要能解释数据的上下文知识。对于普通用户，如果发现旧软盘，建议： 1. 不要急于尝试读取，先检查磁盘物理状态 2. 使用成熟的成像工具（如KryoFlux或Greaseweazle）创建镜像 3. 将镜像文件与读取日志一同归档软盘可能终将消失，但保存它们所积累的方法论，将惠及未来所有濒危数字介质的抢救工作。

IEEE AI1个月前原文

110

热成像相机与AI联手，助船只避开灰鲸

新上线

在旧金山湾，灰鲸的意外停留正成为航运安全的隐患。一项融合热成像相机与人工智能的监测系统，正试图为这片繁忙水域的船只提供实时“鲸鱼预警”，以减少致命碰撞风险。 ## 灰鲸的“危险停靠” 每年，数以千计的灰鲸沿北美西海岸迁徙，往返于阿拉斯加和墨西哥之间。然而，近年来，越来越多的灰鲸在旧金山湾内“临时停靠”，甚至滞留数周。这些体长可达15米、重约40吨的庞然大物，突然出现在航运通道中，对船只和自身都构成致命威胁。据统计，仅在2023年，加州海岸就记录了至少12起灰鲸被船只撞击的事件。 ## 技术方案：热成像+AI 针对这一问题，旧金山湾渡轮公司正联合科技公司，开发一套基于热成像和AI的自动监测系统。该系统将在渡轮航线上安装热成像摄像头，通过捕捉鲸鱼与海水之间的温差来识别其位置。与传统光学摄像头相比，热成像在夜间、雾天或低能见度条件下更具优势——而这正是鲸鱼活动频繁且难以被肉眼发现的关键时段。 AI模型则负责实时分析热成像视频流，过滤掉波浪、船只尾流等干扰信号，精准标注出鲸鱼的轮廓和运动轨迹。一旦检测到鲸鱼靠近航线，系统会立即向船长发送警报，并建议减速或改道。 ## 从被动避让到主动预警过去，船只主要依靠船员目视观察或被动接收其他船只的通报来规避鲸鱼。这种方式依赖个人经验，且容易受天气、光线和疲劳影响。新系统则实现了从“被动避让”到“主动预警”的转变：AI能够提前数分钟甚至数十分钟发现鲸鱼，为船只留出足够的反应时间。目前，该系统已在部分渡轮上完成初步测试，识别准确率超过90%。下一步，团队计划将摄像头网络扩展至整个湾区，并整合多艘船只的监测数据，构建一张覆盖主要航道的“鲸鱼感知网”。 ## 行业意义与挑战这一案例凸显了AI在生态保护与航运安全交叉领域的应用潜力。类似的技术此前已被用于监测鲸鱼、海豚等海洋哺乳动物，但多在研究或小型试点阶段。旧金山湾的实践则向商业化、规模化迈出了关键一步。不过，挑战依然存在。例如，热成像在极端天气下的稳定性、AI模型对罕见行为（如幼鲸紧贴母鲸）的识别能力，以及如何避免因频繁警报导致船长“警报疲劳”等问题，都需要持续优化。此外，系统部署成本也是影响推广的关键因素。尽管如此，随着国际海事组织对船舶撞击鲸鱼事件愈发重视，类似的热成像+AI方案有望成为未来智能航运的标配。正如项目负责人所言：“我们不是在取代船员，而是在给他们一双永不疲倦的眼睛。”

IEEE AI1个月前原文

111

Pavona 推出安全芯片开放硬件生态系统，从 OpenTitan“信任根”起步

新上线

在半导体与安全领域，一场由开源驱动的变革正在加速。近日，Pavona 公司正式宣布推出面向安全芯片的开放硬件生态系统，其首个核心组件基于 **OpenTitan** 项目——一个由 Google 等企业主导的开源“信任根”（Root of Trust）芯片设计。这一举措旨在打破传统安全芯片设计的封闭壁垒，推动硬件安全的透明化与可定制化。 ## 从“信任根”到开放生态 “信任根”是任何安全系统的基石，它负责在设备启动时验证固件与软件的完整性。传统上，这类芯片由少数厂商专有设计，用户难以审计其安全性。OpenTitan 作为首个开源信任根项目，已经为服务器、笔记本电脑等设备提供了可验证的硬件安全基础。Pavona 此次发布的生态系统，不仅包含 OpenTitan 兼容的硅 IP（知识产权核），还提供开发工具、参考设计以及社区协作框架，让开发者能够基于开放标准构建从 IoT 设备到数据中心的全栈安全方案。 ## 为何需要开放硬件？与软件开源不同，硬件开源面临设计成本高、制造门槛大等挑战。但近年来，RISC-V 架构的兴起已证明开放指令集能够降低芯片设计门槛。Pavona 认为，安全芯片领域同样需要开放生态来应对日益复杂的威胁： - **透明性**：开源硬件允许安全专家审计设计中的后门或漏洞，避免“黑箱”风险。 - **灵活性**：企业可根据特定应用场景定制信任根，无需受制于单一供应商。 - **成本效益**：通过共享 IP 和协作设计，降低中小型企业的安全芯片开发成本。 ## 行业影响与未来展望 Pavona 的发布正值全球对硬件供应链安全的关注升温。从政府机构到云服务商，都在寻求可验证的、不受出口管制影响的安全方案。开放硬件生态系统有望成为这一趋势的关键推动力。不过，开放硬件也面临长期维护与标准化挑战。Pavona 表示，将采取类似 Linux 基金会的治理模式，通过社区贡献与商业支持双轨并行，确保生态的持续演进。 ## 小结 Pavona 的开放硬件生态系统，为安全芯片领域注入了一股开源活力。从 OpenTitan 信任根出发，它有可能重塑硬件安全的设计、验证与部署流程。对于关注供应链安全与自主可控的行业而言，这无疑是一个值得长期观察的动向。

IEEE AI1个月前原文

112

Pavona 推出开源硬件生态系统，打造安全芯片新范式

新上线

近日，一家名为 **Pavona** 的新兴企业宣布推出一个全新的开源硬件生态系统，旨在为安全芯片设计提供模块化、可复用的基础组件。该生态系统的首发核心是基于 **OpenTitan** 的“信任根”（root-of-trust）组件，标志着开源硬件在安全领域的又一次重要突破。 ## 从 OpenTitan 到 Pavona：信任根的开放之路 OpenTitan 是由 Google 等多家科技巨头共同发起的开源项目，旨在打造一个透明、可审计的信任根芯片设计。信任根是硬件安全的基础，它负责验证系统启动过程中的每一个环节，确保设备从通电起就处于可信状态。然而，OpenTitan 本身更偏向于一个参考设计，实际应用时需要大量定制工作。 Pavona 的定位正是填补这一空白。它提供了一套 **“启动套件”**，包括硬件模块、参考设计和软件工具，让开发者能够基于 OpenTitan 快速构建符合自身需求的安全芯片。这不仅降低了安全芯片的开发门槛，也使得更多中小型企业和研究机构能够参与到硬件安全创新中来。 ## 开源硬件的生态化探索与开源软件不同，开源硬件一直面临着设计复用难、工具链不统一、验证成本高等挑战。Pavona 的做法是构建一个 **模块化的硬件生态系统**，将复杂的芯片设计拆解为可独立开发、测试和集成的功能块。开发者可以根据需要选择信任根、加密引擎、安全存储等模块，像搭积木一样组合出完整的芯片方案。这种思路借鉴了开源软件中“包管理”和“库”的概念，但在硬件领域实现起来更为复杂。Pavona 不仅提供了模块本身，还配套了相应的 **软件驱动和验证工具**，确保不同模块之间的互操作性。这对于推动开源硬件从“爱好者玩具”走向“工业级应用”至关重要。 ## 行业意义与挑战在当今的数字化时代，硬件安全已成为从物联网设备到数据中心服务器的刚需。然而，传统安全芯片设计往往被少数大厂垄断，且闭源的设计使得安全审计变得困难。Pavona 的开源生态系统有望改变这一局面： - **透明度提升**：开源设计允许全球安全专家共同审查，发现并修复潜在漏洞。 - **降低成本**：模块化复用减少了重复设计工作，缩短了产品上市时间。 - **促进创新**：开放的平台鼓励更多参与者贡献新模块，加速技术演进。不过，开源硬件也面临一些现实挑战。例如，芯片制造的物理特性决定了其迭代周期远长于软件，且硬件 Bug 的修复成本极高。此外，如何确保社区贡献的模块质量、如何建立可持续的商业模式，都是 Pavona 需要解决的问题。 ## 未来展望 Pavona 的推出是开源硬件运动的一个重要里程碑。它不仅为安全芯片设计提供了新的基础设施，也可能催生出一个类似 Linux 在软件世界中的生态效应。随着更多企业和开发者加入，我们有望看到更多基于 Pavona 的定制化安全芯片出现，覆盖从智能卡到云服务器的广泛场景。当然，这仍是一个早期项目。Pavona 团队需要持续完善工具链、吸引社区贡献，并与芯片代工厂建立合作关系，才能真正实现“让安全芯片触手可及”的愿景。对于关注硬件安全和开源生态的从业者而言，Pavona 无疑是一个值得密切跟踪的新动向。

IEEE AI1个月前原文

113

重拾“社会工程”：为何我们不能修复拒绝命名的问题

新上线

“社会工程”一词，在当今网络安全语境下，几乎成了“恶意操纵”的代名词。然而，系统工程师、**《棘手问题：如何工程化一个更美好的世界》**作者 **Guru Madhavan** 在 IEEE Spectrum 发表观点文章，呼吁我们重新审视这一概念，将其从贬义中剥离，恢复其作为解决复杂社会问题工具的本意。 ### 被污名化的术语社会工程（Social Engineering）原本指运用社会科学原理来设计社会制度、流程和行为，以达成积极的社会目标。然而，随着网络钓鱼、电话诈骗等攻击手段的泛滥，“社会工程师”几乎等同于“黑客”或“骗子”。这种语义窄化导致一个严重后果：我们丧失了描述和设计有益社会干预措施的语言。Madhavan 指出：“**如果我们不能命名它，就无法修复它。**” ### 为何需要“好的社会工程” 现代社会面临诸多“棘手问题”（Wicked Problems）——气候变化、公共卫生、社会不平等——这些问题没有简单的线性解决方案，往往需要跨学科协作和对人类行为的深刻理解。这正是社会工程可以发挥价值的地方。例如，通过设计更直观的公共空间引导人流、优化税收表单提高合规率、或利用行为经济学鼓励节能行为，这些都是社会工程的应用。 ### 从对抗到协作在网络安全领域，社会工程常被视为需要防御的威胁。但 Madhavan 主张，我们也可以主动运用其原理来增强系统韧性。例如，设计更人性化的安全提示、通过“助推”鼓励用户设置强密码、或在组织内部建立安全文化。这些做法本质上都是社会工程，却因术语的负面联想而被忽视。 ### 回归工程本质工程的核心是解决问题。Madhavan 认为，拒绝承认社会工程的建设性用途，无异于放弃了一种强大的方法论。他呼吁学术界和业界重新定义这一术语，区分“恶意社会工程”和“建设性社会工程”，并鼓励工程师与社会科学家的合作。 ### 小结 “社会工程”不应成为禁忌词。通过重拾其原本含义，我们不仅能为解决复杂社会问题提供新思路，还能在网络安全等传统领域开辟出从对抗转向协作的新路径。正如 Madhavan 所言：**“我们无法修复拒绝命名的问题。”** 重新命名，是解决问题的第一步。

IEEE AI1个月前原文

114

基于脑信号的语音音量增强系统问世，助力听障人士

新上线

一项新的生物医学工程研究展示了一种能够根据脑信号自动调节语音音量的系统，为听障人士提供了更智能的听觉辅助方案。该系统通过监测大脑对声音的反应，实时调整输出音量，确保用户在不同环境下都能清晰听到关键语音信息。 ### 技术原理：脑机接口与自适应音频该系统的工作原理类似于一个闭环反馈回路。它利用非侵入式脑电图（EEG）设备捕捉用户大脑对音频信号的电生理反应。当大脑检测到语音内容但感觉音量不足时，会产生特定模式的神经信号；系统识别到这些信号后，会立即提升语音音量，直到大脑反应表明音量已足够。这种自适应控制避免了传统助听器需要手动调节或依赖环境噪声估算的局限。 ### 应用场景与潜在影响对于听力损失人群，尤其是那些在嘈杂环境中难以听清对话的人，这项技术有望带来显著改善。与传统助听器相比，它能够更精准地响应用户的听觉需求，减少背景噪声干扰，同时降低用户的操作负担。此外，该技术也可用于智能耳机、音频辅助设备甚至公共广播系统，为听力正常者提供更个性化的听觉体验。 ### 挑战与未来方向目前该系统仍处于研究阶段，主要挑战包括：脑电信号采集的舒适性和稳定性、实时处理的计算效率，以及如何区分听力需求与注意力变化。未来，随着可穿戴脑机接口设备的成熟，这种基于脑信号的音量控制有望集成到更轻便、隐蔽的助听设备中，甚至可能通过闭环神经调控进一步修复听觉功能。 ### 小结这项研究代表了听觉辅助技术从“被动放大”向“主动感知”的重要转变。通过直接读取大脑的听觉反馈，系统能够提供更自然、更智能的听力支持，有望显著提升听障人士的生活质量。

IEEE AI1个月前原文

115

雷达能区分昆虫种类：微多普勒特征助力监测关键传粉者

新上线

雷达技术正从追踪飞机和天气，转向一个全新的应用领域——区分不同种类的昆虫。一项最新研究表明，通过分析昆虫飞行时产生的**微多普勒特征**，雷达可以精确识别蜜蜂、黄蜂等不同物种，为监测全球日益减少的传粉昆虫种群提供了高效的新工具。 ## 微多普勒：昆虫的“飞行指纹” 当昆虫飞行时，它们的翅膀振动、身体摆动和肢体运动会在雷达回波中产生独特的频率调制，这就是**微多普勒信号**。不同物种的翅膀形状、大小、振动频率和飞行模式各不相同，这些差异会在雷达信号中留下可区分的“签名”。研究人员通过收集多种昆虫的雷达回波数据，训练机器学习模型，成功实现了对蜜蜂、黄蜂、苍蝇等物种的自动分类，准确率超过90%。 ## 为何需要昆虫雷达？全球传粉昆虫（如蜜蜂、蝴蝶等）的数量正因气候变化、农药使用和栖息地丧失而急剧下降。传统监测方法依赖人工捕捉和观察，耗时费力且难以覆盖大面积区域。雷达技术可以**非接触、大范围、全天候**地监测昆虫活动，尤其适合在农田、森林等生态敏感区域部署。 ## 技术挑战与前景目前，这项技术仍面临一些挑战：昆虫体型极小，雷达回波微弱，容易受环境杂波干扰；此外，不同昆虫的微多普勒特征可能重叠，需要更精细的算法和更高分辨率的雷达系统。但研究团队表示，随着**毫米波雷达**和**人工智能**的进步，这些问题正在逐步解决。未来，这种雷达系统有望安装在无人机或地面观测站上，实时监测传粉昆虫的种群动态，为生态保护和农业政策制定提供关键数据。 ## 小结从区分飞机型号到识别昆虫物种，雷达的“感官”正在变得越来越敏锐。这项研究不仅展示了AI与雷达融合的潜力，也为生物多样性监测开辟了一条新路。如果技术成熟，我们或许很快就能用雷达“听懂”昆虫的飞行语言，守护地球的生态网络。

IEEE AI1个月前原文

116

视频星期五：Atlas 对决冰箱

新上线

欢迎来到本周的“视频星期五”！本期机器人精选视频中，最引人注目的莫过于波士顿动力（Boston Dynamics）的人形机器人 **Atlas** 与一台冰箱的“对决”。这不仅仅是一场力量展示，更是一次工程与技术的视觉盛宴。 ## Atlas 的灵活性与力量在最新发布的视频中，Atlas 展示了其令人惊叹的全身协调能力。它能够同时旋转多个关节达 360 度，这种动作对于人形机器人来说极具挑战性，要求精确的力矩控制和平衡算法。与冰箱的互动不仅考验了 Atlas 的抓取和搬运能力，更体现了其在复杂环境中的适应性。 ## 机器人视频精选除了 Atlas 的精彩表现，本周的视频集锦还涵盖了其他令人印象深刻的机器人技术。从工业机械臂到仿生机器人，每一段视频都展示了机器人领域的最新进展。这些视频不仅为技术爱好者提供了视觉享受，也为研究人员提供了宝贵的灵感。 ## 行业背景与意义人形机器人的发展一直是 AI 和机器人领域的焦点。Atlas 的每一次进步都标志着硬件和软件协同优化的成果。与冰箱这样的日常物品互动，看似简单，实则涉及物体识别、路径规划、力控抓取等多个复杂环节。这类演示为未来机器人在家庭、仓储等场景中的实际应用奠定了基础。波士顿动力通过定期发布机器人视频，不仅保持了公众对机器人技术的热情，也推动了整个行业对更高性能机器人系统的追求。从早期的液压驱动到现在的电动执行器，Atlas 的进化史本身就是一部机器人技术发展的缩影。 ## 结语 “视频星期五”不仅是娱乐，更是教育。每一段视频背后都凝聚着工程师们的智慧和汗水。随着 AI 和机器人技术的融合，我们有理由期待更多像 Atlas 这样的机器人能够走出实验室，真正服务于人类生活。 *注：本文基于标题和摘要撰写，未包含完整视频内容细节。*

IEEE AI1个月前原文

117

毛利语文本转语音模型：拒绝大科技价值观，守护土著语言主权

新上线

在全球人工智能浪潮中，大型科技公司主导着语音助手、翻译工具和文本转语音（TTS）模型的发展，但它们的价值观往往与土著社区的需求相冲突。最近，新西兰怀卡托大学AI研究所联合主任、计算机科学家Te Taka Keegan领导的项目，开发了一款面向毛利语的文本转语音模型。该模型并非简单套用大科技公司的技术框架，而是从数据收集到模型训练全程由毛利社区主导，确保符合毛利文化价值观和语言特性。 ## 为什么需要土著拥有的AI模型？主流TTS模型通常依赖海量标注数据，这些数据多来自英语等主流语言，且训练过程往往忽视少数语言的语音、语法和文化背景。对于毛利语这类濒危语言，大科技公司的模型可能产生不自然的发音、误用敬语，甚至因训练数据不足而表现糟糕。更关键的是，数据主权问题——谁拥有语音数据？谁决定模型的使用方式？ Keegan团队的做法是：**从社区收集高质量的毛利语语音数据**，由母语者参与标注和验证，确保模型能准确反映毛利语的韵律、重音和方言差异。模型本身也采用开源架构，避免被单一商业公司控制，社区可以自由部署、修改和扩展。 ## 技术路径与挑战该模型基于**端到端TTS架构**，使用Transformer和WaveNet等技术，但针对毛利语音节结构（如长元音、双元音和声门塞音）进行了优化。训练数据来自数百位毛利语母语者，涵盖不同年龄段和地区方言，以提升模型的泛化能力。与传统模型不同，团队刻意避免使用自动语音识别（ASR）生成的伪标签，因为这类数据可能引入错误，损害语言质量。挑战在于：毛利语是低资源语言，可用的公开数据远少于英语。团队通过社区合作、口述历史录音和语言振兴计划获取数据，并设计了**数据增强策略**（如音高调整、速度变化）来扩充训练集。此外，模型需要处理毛利语中特有的**语法结构**，例如动词前缀和名词所有格标记，这些在英语TTS中并不常见。 ## 土著AI模型的全球趋势毛利语TTS项目并非孤例。全球范围内，多个土著社区正在开发自己的AI模型： - **加拿大**：因纽特语和克里语的语音助手，由土著非营利组织主导，重点保护方言多样性。 - **澳大利亚**：原住民语言TTS项目，结合传统故事叙述和现代语音合成，用于教育场景。 - **北欧**：萨米语自然语言处理工具，强调数据主权和社区许可协议。这些项目的共同点是：**拒绝大科技公司的“一刀切”解决方案**，转而建立社区拥有的数据基础设施和模型。它们通常采用开源许可，确保技术利益回流社区，而不是被商业公司垄断。 ## 对AI行业的意义毛利语TTS模型挑战了AI发展的主流叙事：技术必须由硅谷巨头定义。它证明，**低资源语言模型可以做到高质量，只要社区深度参与**。这为其他濒危语言提供了可复制的路径： 1. **数据主权优先**：社区控制数据收集、存储和使用。 2. **文化适配**：模型设计必须尊重语言的文化内涵（如敬语、禁忌词汇）。 3. **开源与可持续**：避免供应商锁定，允许社区长期维护。当然，这类项目也面临资金和人才短缺问题。Keegan团队呼吁更多政府和基金会支持土著AI研究，并建议大科技公司提供技术基础设施，但将控制权交给社区。 ## 小结毛利语TTS模型不仅是技术成果，更是文化自决的象征。它提醒我们：AI的价值观并非中性，而是由创造者决定。当社区掌握技术主权时，AI才能真正服务于多元文化，而不是强化主流语言的霸权。

IEEE AI1个月前原文

118

开源软件开始帮助机器人“思考”

新上线

在人工智能领域，开源运动正从语言模型向机器人领域蔓延。一个关键信号是，Hugging Face 社区平台 LeRobot 如今已托管超过 **58,000 个数据集**，这些数据集专门用于训练机器人 AI 模型。 ## 从语言到动作：开源社区的跨界长期以来，机器人 AI 的开发高度依赖闭源系统和企业级资源。但 LeRobot 的快速增长表明，开源社区正在填补这一空白。该平台不仅提供数据集，还包含预训练模型和仿真工具，让研究人员和爱好者能够更轻松地构建机器人智能。 ## 为什么是现在？三个因素推动了这一趋势： - **数据民主化**：高质量机器人数据集曾经稀缺且昂贵，现在通过社区贡献大量积累。 - **模型复用**：像 Hugging Face 这样的平台允许开发者微调现有模型，而不是从零开始。 - **协作加速**：开源社区通过共享代码和最佳实践，降低了入门门槛。 ## 这意味着什么？对于行业而言，开源机器人 AI 可能带来类似大语言模型领域的变革——更快的创新周期、更低的成本以及更广泛的应用场景。例如，小型团队现在可以基于 LeRobot 数据集训练机械臂完成精细操作，而无需昂贵的实验室环境。 ## 挑战与展望尽管前景乐观，机器人 AI 开源仍面临挑战：物理世界的复杂性导致仿真与现实差距（sim-to-real gap），且安全性验证比纯软件更困难。但 LeRobot 的数据规模仍在增长，社区活跃度持续上升，这预示着开源机器人 AI 正在从实验走向实用。

IEEE AI1个月前原文

119

Bolt 挑战英伟达：专注尖端图形与高精度计算

新上线

一家名为 **Bolt** 的初创公司正试图在图形处理器（GPU）领域挑战行业巨头英伟达。与主流追求通用计算性能不同，Bolt 的策略是**专注于高精度数学运算**，希望在特定领域建立技术优势。 ## 差异化竞争：高精度计算 Bolt 的核心思路是，在 AI 推理、科学计算和高端图形渲染等场景中，**双精度（FP64）甚至更高精度的浮点运算**仍然至关重要。英伟达近年来的产品，如消费级 GeForce 和专业级 A100/H100，虽然单精度和半精度性能强悍，但双精度性能相对较弱。Bolt 则计划通过专门的硬件设计，大幅提升高精度运算效率，从而在需要高保真度模拟的领域（如气候建模、药物发现、电影级渲染）抢占市场。 ## 产品路线与市场定位据透露，Bolt 正在开发代号为 **Zeus** 的 GPU 架构，其双精度浮点性能预计是同等功耗英伟达产品的数倍。该公司还计划支持 **原生光线追踪** 与 **实时路径追踪**，并针对行业标准库（如 CUDA 和 OpenCL）提供兼容层，以降低开发者迁移门槛。不过，Bolt 并非要全面取代英伟达。其目标市场更偏向**专业图形工作站**、**高性能计算（HPC）集群**以及需要极高计算精度的 **AI 训练** 场景。对于普通游戏玩家或消费级用户，Bolt 的产品可能短期内不会直接竞争。 ## 面临的挑战英伟达在 GPU 领域拥有深厚的生态系统积累：CUDA 生态、广泛开发者社区、以及从数据中心到边缘设备的全栈布局。Bolt 要挑战这一地位，不仅需要硬件性能上的突破，更需解决**软件兼容性**和**开发者信任**问题。此外，制造先进制程芯片的高昂成本，以及台积电等代工厂的产能分配，也都是不容忽视的障碍。 ## 行业意义 Bolt 的出现反映了 GPU 市场的一个新趋势：**差异化细分**。随着 AI 和高性能计算需求日益多样化，单一架构难以满足所有场景。英伟达虽占据统治地位，但像 Bolt 这样的初创公司若能找准利基市场，仍有机会在特定领域分得一杯羹。 ## 小结 Bolt 以高精度计算为切入点，试图在英伟达的强势领域打开缺口。尽管前路挑战重重，但其专注细分市场的策略为行业带来了新的想象空间。未来几年，GPU 领域的竞争可能会更加多元。

IEEE AI1个月前原文

120

用手机级激光雷达实现“隔墙观物”：低成本非视域成像新突破

新上线

**麻省理工学院媒体实验室（MIT Media Lab）的研究人员开发出一种新型非视域成像系统，仅依靠智能手机级别的激光雷达传感器，就能“看到”拐角后的物体轮廓。** 这项技术有望大幅降低自动驾驶汽车、机器人及安防设备中“透视”障碍物的成本门槛。传统的非视域成像系统通常依赖昂贵、高功率的飞秒激光器或单光子雪崩二极管（SPAD）阵列，设备体积庞大且成本高达数万美元。而MIT团队提出的方法，利用消费级激光雷达（如iPhone 12 Pro及以上机型搭载的LiDAR扫描仪）即可实现。其核心原理是：向拐角处的地面等漫反射表面发射激光脉冲，光线经反射后照射到隐藏物体，再次反射回的微弱信号被激光雷达捕捉。通过分析光子的飞行时间与空间分布，算法可重建隐藏物体的粗略形状。 **该系统的关键在于算法对噪声的鲁棒性。** 消费级LiDAR的信噪比远低于科研级设备，但研究人员通过多帧累积和时空相关性滤波，成功从噪声中提取出有效信号。实验显示，该系统能在1米范围内识别出约20厘米大小的人体模型或字母形状，分辨率虽不足以看清人脸细节，但足以判断“是否有人”或“大致动作方向”。 **应用前景方面，该技术可显著提升机器人导航的安全性。** 例如，扫地机器人可提前感知墙角后的障碍物或宠物，避免碰撞；自动驾驶汽车在十字路口或停车场可“预判”突然出现的行人或车辆。此外，在搜救场景中，无人机可借助此技术探测废墟后的生命迹象。 **当前局限与未来方向：** 系统目前仅适用于静态或慢速移动物体，且对场景光照条件敏感（强环境光会淹没信号）。MIT团队正尝试结合深度学习提升重建速度与分辨率，并探索与现有安防摄像头、扫地机器人等消费电子产品的集成方案。 **行业影响：** 非视域成像长期是计算机视觉领域的“圣杯”之一。以往受限于成本，该技术仅停留在实验室。此次用手机级LiDAR实现突破，意味着未来每台配备LiDAR的智能设备都可能具备“透视”能力，开启从消费电子到工业自动化的全新应用维度。

IEEE AI1个月前原文

上一页6 / 15下一页