从节省带宽和能源到更敏捷的实时性能,在嵌入式应用中实施人工智能带来的巨大效益远不止于流行术语。Nordic Semiconductor为客户提供两项独特技术——Neuton模型和Axon NPU,以覆盖业内最广泛的设备、应用及客户需求。
Neuton模型
定制Neuton模型是基于您的数据,通过我们专利的网络生长算法构建的超微型边缘AI模型,可完美适配任何Nordic SoC或SiP设备,利用其主应用核心(CPU)运行边缘AI任务。

- 内存占用比 TensorFlow Lite 模型小 10 倍
- 比在CPU上运行TensorFlow Lite模型快10倍且更节能
- 使用我们的框架创建的自定义Neuton模型的平均内存占用低于5 KB
Axon NPU
Axon NPU 是我们专用的 AI 加速器核心,旨在提升 TensorFlow Lite 模型的运行速度和效率,并已集成于我们性能最强大的 SoC 芯片中。

- 比在CPU上运行相同的TensorFlow Lite模型快15倍,且能效更高
- 相比最接近的竞争产品,能效提升8倍
- 与最接近的竞争产品相比,推理速度提升7倍
为何选择边缘AI?
边缘AI是低功耗无线应用的理想选择,因为它使设备能够本地分析数据,从而减少持续无线电传输的需求——这是无线系统最大的能量消耗源。通过在设备上直接处理传感器信息,您可最大限度减少网络流量、降低延迟,并在连接间歇或不可用时仍保持功能运行。这种本地智能使设备唤醒频率降低,仅传输有效结果,并能依靠小型电池持续运行数月乃至数年。同时,数据本地化存储既增强了隐私与安全性,又实现了更快速、更可靠的决策过程。
什么是“边缘AI”?
边缘AI是指在非云端硬件上运行AI算法和神经网络的概念。其涵盖范围广泛,从边缘服务器和网络基础设施,到高性能计算机、笔记本电脑和智能手机,直至Nordic超低功耗SoC内部的微控制器及其应用设备。在Nordic讨论边缘AI时,我们通常仅指与Nordic SoC和SiP相关的部分——即在低功耗无线设备上运行AI算法和神经网络,将边缘AI真正带到最前沿。
两项独特互补的技术
Nordic Semiconductor 为边缘人工智能提供两项独特技术,仅适用于 Nordic 硬件,针对不同应用场景并支持不同硬件目标。
Neuton模型
Neuton模型是基于我们专有神经网络框架创建的超小型边缘AI模型。其体积小巧且运行高效,使在Nordic任何SoC的常规CPU核心上运行边缘AI应用成为可行方案,可解决基于时间序列传感器数据(如加速度计、惯性测量单元、光电血氧仪、温度及电力测量传感器输出)的多种AI挑战。
Axon NPU
Axon是我们集成的AI加速器,旨在提升TensorFlow Lite模型的运行速度与效率。Axon NPU将集成于部分Nordic SoC产品中,适用于处理基于高频率时间序列数据的边缘AI挑战,以及音频和图像分类任务。
了解更多关于nRF54LM20B的信息——这是我们首款集成Axon神经处理单元(NPU)的产品。
独特的自生长神经网络
Neuton模型
Neuton模型是基于我们专有神经网络框架创建的超微型边缘AI模型。其体积小巧且运行高效,使在Nordic SoC的普通CPU核心上运行边缘AI应用成为解决诸多AI挑战的可行方案。基于时间序列传感器数据的应用(如加速度计、惯性测量单元、光电血氧仪、温电传感器输出)是Neuton模型的理想场景。该模型通过逐个神经元构建,打造出兼具最高精度、最高效率与最小体积的神经网络。此过程无需人工优化或用户输入网络架构,可生成不含冗余神经元与连接的独特神经网络。
在Nordic边缘人工智能实验室中培育您的定制Neuton模型
定制化Neuton模型
构建边缘AI模型的更智能方案
挑战
传统神经网络面临根本性挑战:它们需要人工架构设计,且依赖常会产生数百万参数臃肿模型的方法。数据科学家必须在资源密集且不精确的试错过程中,费力调整从学习率到层深度的数十个变量。
Neuton模型解决方案
定制化Neuton模型采用颠覆性方法。它摒弃预设结构,通过逐个神经元构建神经网络,在学习过程中自动确定最优架构。这种精细化构建流程结合专利全局优化算法(规避了传统梯度下降法的缺陷),在保持精度的同时生成惊人紧凑的模型。
成果
打造全自动化系统,使用门槛极低。只需提供数据集与目标变量,Neuton将自动完成结构构建、交叉验证及过拟合控制。该框架生成的模型体积远小于传统神经网络,可在资源受限设备上实现更快的预测与部署,同时保持卓越的准确性和泛化能力。
Nordic Edge AI Lab
Nordic Edge AI Lab (边缘人工智能实验室)是您通往超高能效边缘智能的门户。依托我们专利的神经网络框架,它能在数分钟内将您的传感器数据转化为紧凑高效的人工智能模型,随时可部署于Nordic的超低功耗SoC和SiP芯片上。无需数据科学知识或经验,只需优质数据集和积极态度,其余工作由Edge AI Lab全权处理。
边缘AI实验室文档请参阅此处。
前往 Nordic Edge AI Lab
基准测试
轴承故障检测案例研究
基于凯斯工程学院数据集构建的模型
|
Total Footprint
|
LiteRT
|
Neuton
|
Neuton Advantages
|
|
NVM
|
TinyML framework (model + inference engine + DSP)
|
61.7
|
6.6
|
9 times smaller model
|
|
RAM
|
TinyML framework (model + inference engine + DSP)
|
11.2
|
1.2
|
9 times smaller model
|
|
Inference time (ms)
|
360
|
1,46
|
246 times faster
|
|
Holdout validation accuracy
|
0.79
|
0.98
|
19% higher accuracy
|
测试在nRF52840平台上同时运行Neuton和LiteRT模型,并使用相同的验证数据集进行测试。
“Magic Wand”手势识别
|
Total Footprint
|
LiteRT
|
Neuton
|
Neuton Advantages
|
|
NVM
|
TinyML framework (model + inference engine + DSP)
|
79.96
|
5.42
|
14 times smaller model
43% reduction of total NVM use
|
|
Device drivers and business logic
|
93.47
|
93.47
|
|
RAM
|
TinyML framework (model + inference engine + DSP)
|
18.2
|
1.72
|
10 times smaller model
26% reduction of total RAM use
|
|
Device drivers and business logic
|
45.69
|
45.69
|
|
Inference time (µs)
|
55,262
|
1,640
|
33 times faster
|
|
Holdout validation accuracy
|
0.93
|
0.94
|
0.7% higher accuracy
|
测试在nRF52840平台上同时运行Neuton和LiteRT模型,并使用相同的保留数据集进行验证。
应用案例
预测性维护及楼宇自动化系统
在楼宇自动化系统中,嵌入式机器学习技术可用于实时监测设备运行状态,并在故障发生前进行预测。通过在边缘设备上直接分析传感器数据,这些系统能够识别暖通空调、照明及安防系统的运行模式与异常情况,无需依赖持续的云端连接。此方案不仅能减少设备停机时间、优化能源使用、降低维护成本,更能打造更智能、响应更迅速的楼宇环境。
能在每个节点进行本地数据分析的智能传感器网络
智能传感器网络可利用嵌入式机器学习在信息源头直接处理数据,从而降低延迟并减少带宽需求。每个节点都能独立识别模式、过滤噪声并作出实时决策,从而构建更高效且可扩展的系统。这种去中心化方法显著提升了响应速度和可靠性,尤其在环境监测、工业自动化和智能建筑等应用场景中,即时洞察与最小化数据传输至关重要。
遥控器与可穿戴设备的动作和手势识别
对于遥控器和可穿戴设备,嵌入式机器学习技术能够直接在设备端实时解析动作数据。通过在嵌入式处理器上运行轻量级机器学习模型,这些设备无需持续连接云端即可精准识别并分类用户手势。这使得在无接触控制、健身追踪和辅助技术等应用场景中,能够实现直观、低延迟的交互体验,同时兼顾能效优化与数据隐私保护。
智能健康可穿戴设备的健康与活动监测
智能健康可穿戴设备日益采用嵌入式机器学习技术,可在设备端直接实现生物特征与运动数据的实时分析。这类设备能以极低延迟追踪生命体征、检测异常状况并分类身体活动。通过本地化数据处理,它们既能保障用户隐私、延长电池续航,又能提供即时反馈,成为持续个性化健康监测及潜在医疗问题早期预警的理想选择。
Axon NPU
无妥协的边缘AI
多年来,为无线物联网设备添加AI功能意味着必须在电池寿命和性能之间做出取舍。在CPU上运行TensorFlow Lite通常速度过慢且内存消耗巨大,而独立NPU则增加了成本和复杂性。尽管Neuton模型已在nRF54L系列CPU上实现了高效的边缘AI处理,但音频、成像和高速率传感器数据等高负载任务仍需专用加速器。
集成式AI加速
Axon是Nordic自主研发的NPU,集成于高内存nRF54LM20B SoC中。其加速TensorFlow Lite模型的推理速度比CPU快达15倍,性能比最接近的竞争无线NPU高出7倍,能效提升8倍,为超低功耗设备带来强劲的边缘AI能力。
简化设计,拓展可能
通过将NPU集成至芯片,Axon消除了对独立加速器的需求,有效降低功耗、物料成本及开发复杂度。从异常检测、生物识别到声音/关键词/图像识别,Axon在各类应用场景中实现业界领先的能效表现——这一切都得益于全加速边缘AI技术的赋能。
搭载这款AI加速器的产品
nRF54LM20B 系统级芯片
集成Axon神经处理单元(NPU)的超低功耗无线系统级芯片,适用于硬件加速的边缘人工智能应用,支持蓝牙低功耗、信道探测、蓝牙Mesh、Zigbee、Thread、Matter、Aliro及2.4 GHz专有协议。
电子书
人工智能如何赋能物联网?本期电子书将助您将强大的边缘人工智能应用到产品中!
下载免费电子书