人工智能AI算法开发流程：确定需求、准备数据、选取模型、训练模型、部署

在线商城/产品订购

(+86)15396128591(微信同号)

简体中文

support@nnewn.com

访问XNIUPI小牛派开发板

首页 >> 服务与支持 >> 技术分享 >> 【AI开发_02】AI算法开发流程

点击头像，立即联系微信客服

福州牛新牛科技有限公司是一家专业的嵌入式人工智能物联网（Embedded AIoT）产品供应商和技术方案商，同时也是一家集设计、研发、生产和销售于一体的国家级高新技术企业。公司批量供应AI核心板、工控板、AIoT智能网关、AI边缘计算终端等产品，并提供定制开发服务和一站式AIoT解决方案。NNEWN提供免费技术方案咨询和项目评估，有需要的读者可以点击右侧图标跳转到需求提交页面提交您的项目需求：

【AI开发_02】AI算法开发流程

来源: | 作者:NNEWN | 发布时间: 2021-08-11 | 3631 次浏览 | 分享到:

AI算法开发一般分为如下五个步骤：

一、需求具象化

二、准备数据

三、选取模型

四、训练模型

五、部署

一、需求具象化

算法的功能常常可以用一个短词概括，如人脸识别、司机行为检测、商场顾客行为分析等系统，但是却需要依靠多个子算法的有序运作才能达成。其原因在于子算法的神经网络结构各有不同，这些结构的差异化优化了各个子算法在其功能上的实现效果。

常见的算法模型如下表所示：

模型分类名称	功能
检测模型	检测图像中是否存在目标物体，并给出其在图像中的具体坐标，可同时带分类功能
关键点定位模型	检测图像中的特定目标，并标出关键点位，常见骨骼点位、面部器官点位等
相似度比对模型	比较两个不同的个体的相似度，常见人脸、猪脸识别
分割模型	检测图像中存在的物体，按轮廓或其他标准分割出物体所在的不规则像素区域，可同时带分类功能
OCR模型	识别文字
语音模型	识别音频

以下我们简单举例说明：

1）人脸识别算法== 人脸检测（检测模型）+ 矫正人脸姿态模型（关键点定位模型）+ 人脸比对模型（相似度比对模型）

2）司机行为检测算法 = 人脸识别算法（具体组成如上例）+ 抽烟玩手机等危险动作识别（检测模型） + 疲劳驾驶检测（关键点定位模型）+ 车道线偏移检测（检测模型）

3）商场顾客分析 = 人脸识别算法（具体组成如首例）+ 人体跟踪算法（检测模型 + 相似度比对模型）

只有在确定了具体需求所需要的步骤后，我们才能有的放矢的采集数据，优化模型，训练出合乎我们需求的模型。

二、准备数据

即使准备数据在大多数人看来是繁琐重复的工作，这期间仍有许多细节需要注意的。

数据样本需要良好的多样性。样本多样性是保证算法泛化能力的基础，例如想要识别农产品的功能中，假如我们只是搜集红苹果的数据，那么训练出来的网络就很难将绿色的苹果准确识别出。同时还需要加入充足的负样本，例如我们只是单纯地把农产品的图片数据喂给神经网络，那么我们就很难期望训练出来的神经网络可以有效区分真苹果还有塑料苹果。为了增强算法的可靠性，我们就需要充分的考虑到实际应用场景中会出现什么特殊情况，并将该种情况的数据添加进我们的训练数据里面。

数据样本是否可被压缩。单个样本数据的大小往往决定了网络模型的运行效率，在保证效果的情况下，应当尽量压缩图片的大小来提高运行效率，如112x112的图片，在相同环境下的处理速度将比224x224图片的快4倍左右。但是有些场景却是需要完整的图片来保证图片信息不会丢失，如山火检测一般需要很高的查全率，过度的压缩都会导致查全率下降导致算法效果不佳。

数据需要合适正确的标注与预处理。数据标注在一定程度上决定了训练效果能达到的高度，过多的错误标记将带来一个无效的训练结果。而数据的预处理，是指先对数据做出一定的操作，使其更容易被机器读懂，例如农产品在画面中的位置，如果是以像素点为单位，如农产品的中心点在左起第200个像素点，这种处理方式虽然直观准确，但是会因为不同像素点之间的差距过大，导致训练困难，这个时候就需要将距离归一化，如中心点在图中左起40%宽的位置上。而音频的预处理更为多样，不同的分词方式、傅里叶变换都会影响训练结果。

数据的准备不一定得在一开始就做到毫无遗漏。模型训练完成后，如果有一定的效果但还存在部分缺陷，就可以考虑添加或优化训练样本数据，对已有模型进行复训练修正。即使是后期的优化，增添合适的照片往往是最有效的效果。所以对数据的考量优化应该贯穿整个流程，不能在只是在开头阶段才关注数据样本的问题。

三、选取模型

通常来讲，对于同一个功能，存在着不同的模型，它们在精度、计算速率上各有优劣。模型一般来源于学术研究、公司之间的公开比赛等，所以在研发过程中，就需从业人员持续地关注有关ai新模型的文章；同时对旧模型的积累分析也是十分重要的，这里我们在表2 中列出目前在各个功能上较优的模型结构以供参考。

备注：关于速率的说明：慢：＜10fps；中等：10fps-30fps；快速：＞30fps；

模型类别	模型名称	效果	速率
检测模型	yolov3	精度高，对小物体的识别较弱	中等
	ssd	精度中等，对小物体的识别一般	快速
	fast-rcnn	精度高，对小物体的识别校准	慢
关键点定位模型	mtcnn	精度一般，关键点较少	快
关键点定位模型	openpose	精度高，关键点多，且可适用手、人体关节等功能开发	中等
相似度比对模型	resnet18	精度高	快速
相似度比对模型	resnet50	精度高，鲁棒性佳，有比较强的抗干扰能力	中等
分割模型	mask-rcnn	精度中，分割出画面中的不规则物体	慢

四、训练模型

对于有AI开发经验的研发人员，可以用自己熟悉的常见框架训练即可，如tensorflow、pytorch、caffe等主流框架，我们提供的AI开发套件可以将其轻松转为符合硬件平台的专用模型。

五、部署

研发自主模型后，需先将模型转换为rknn模型，再参考NPU API说明文档，编写应用工程。经过编译后传输至硬件平台上实现部署。

上一篇：【AI开发_03】模型转换环境搭建

下一篇：【AI开发_01】AI概述及应用场景

热门文章推荐

[未分类] 瑞芯微旗舰级8KSoC芯片RK3588规格参数简介及Datasheet下载

2022-10-29
[行业应用] 基于瑞芯微RK3588的AR/VR智能眼镜及智能头盔类产品主板方案

2022-11-04
[行业应用] RK3588已适配银河麒麟操作系统，助力用户应用快速落地

2023-02-07
[行业资讯] 2023年瑞芯微开发者大会落幕，多项技术应用方案已落地

2023-02-28
[行业资讯] RK3399/RK3588成功适配Hailo-8的AI加速模块M.2计算卡，最高算力可达26TOPs

2023-03-09
[行业资讯] 瑞芯微RK3576 AIoT芯片规格及应用场景介绍

2024-01-02
[行业应用] NNEWN-RK3588系列产品已全面适配银河麒麟kylinOS、统信UOS、鸿蒙OpenHarmonyOS等国产操作系统

2022-11-07
[行业应用] 高度集成化模块化的RK3568和RK3588无人机AI控制主板方案

2022-10-29
[技术分享] 瑞芯微RK3588/RK3568等芯片DDR SDRAM支持列表_2022.08.18更新

2022-11-09
[技术分享] 【官方开发文档】RKNN SDK 快速上手指南（RV1106/RV1103）

2023-02-05
[资料下载] 瑞芯微平台RK芯片Datasheet合集

2022-11-11
[技术分享] 瑞芯微RK3588/RK3568等芯片Camera Sensor支持列表_2022.11.09更新

2022-11-09
[行业应用] 基于瑞芯微RK3588S的高性能移动设备及商用平板解决方案

2022-11-21
[行业应用] 基于瑞芯微RK3568的智能NVR/NAS服务器主板方案

2022-11-22
[技术分享] 【官方开发文档】Rockchip SDK申请及同步指南

2023-02-03
[行业应用] 基于瑞芯微RK3588的智能NVR/NAS服务器主板方案

2022-11-18
[技术分享] 瑞芯微RK3588/RK3568等芯片eMMC支持列表_2022.10.31更新

2022-11-09
[行业资讯] 瑞芯微RK628D视频接口转换芯片简介及Datasheet下载

2021-08-28
[技术分享] 【官方开发文档】Rockchip RK3588 eDP显示接口开发指南

2023-02-05
[资料下载] 瑞芯微RK平台软件开发通用文档合集

2022-11-10

12 3

热门产品推荐

RK3588核心板 | NXN-CORE-3588-BTB-5060-V2

核心板

市场价:0.00

价格:0.00

Size：50mm×60mm SoC：Rockchip RK3588 CPU：8核64位高性能处理器，4×A76+4×A55，最高主频2.4GHz GPU：Mali-G610 MC4，512GFLOPS，高效率2D引擎 NPU：三核架构，6.0TOPs RAM：8GB LPDDR4X（可选4GB/12GB/16GB) ROM：32GB eMMC（可选64GB/128GB/256GB） Decoder：8K 60FPS H.265/H.264/AV1 Encoder：8K 30FPS H.265/H.264 ISP：2×16M ISP 显示接口：2×HDMI2.1/eDP1.3，2×DP1.4 in TypeC，2×MIPI DSI D/C PHY 视频输入：HDMI2.0 4K@60，4×MIPI CSI，最多4路MIPI摄像头输入 USB接口：2×USB3.0 Type-C OTG，1×USB3.0 HOST，2×USB2.0 HOST 其他高速接口：PCIe3.3 4lane/3×PCIe2.1 or Sata3.0/2×GMAC 软件系统：Android12，Linux5.10 Debian11/Ubuntu20.04，KylinOS/UOS/OpenHarmony国产操作系统 产品定制：支持软硬件定制开发，支持100%国产化定制开发
RK3588核心板 | NXN-CORE-3588-BTB-6080-V2

核心板

市场价:20000.00

价格:2799.00

主板编号：NXN-CORE-3588-BTB-6080-V2 主控芯片：RK3588 运行内存：LPDDR4X，最高可选32GB 内置存储：eMMC，最高可选256GB 电源输入：4V 主板尺寸：50mm×60mm 操作系统：支持Android/Linux，支持根适配银河麒麟/开放鸿蒙等国产操作系统 项目状态：已打板验证 技术支持：软硬件设计资料齐全，可提供硬件设计源文件和软件SDK源代码，可提供有偿技术支持，可根据客户需求进行定制开发
RK3588核心板 | NXN-CORE-3588-MXM-7082-V2

核心板

市场价:20000.00

价格:2799.00

主板编号：N-CORE3588_BTB400_5287 主控芯片：RK3588 运行内存：LPDDR4X，最高可选16GB 内置存储：eMMC，最高可选256GB 电源输入：4V 主板尺寸：52mm×87mm 操作系统：支持Android/Linux，支持根适配银河麒麟/开放鸿蒙等国产操作系统 项目状态：已打板验证 技术支持：软硬件设计资料齐全，可提供硬件设计源文件和软件SDK源代码，可提供有偿技术支持，可根据客户需求进行定制开发
RK3576核心板 | NXN-CORE-3576-260-5070-V1

核心板

市场价:0.00

价格:0.00

Size：50×69.6mm SoC：Rockchip RK3568 CPU：Quad-core Cortex-A55 up to 2.0GHz GPU：Mali-G52 NPU：0.8TOPs RAM：2GB/4GB LPDDR4 ROM：16GB/32GB/64GB/128GB eMMC Decoder：4K 60FPS H.265/H.264/VP9 Encoder：1080P 100FPS H.265/H.264 Interface：HDMI OUT×1/MIPI DSI×2/LVDS×1/eDP×1；MIPI CSI×2；SATA3.0×1；USB3.0×2；USB2.0×2；PCIe3.0×1；G-Ethernet GMAC×2；SDIO3.0×2（for WIFI and SD）；I2S×1/Speaker×1/Mic×1/Hearphone×1；UART/SPI/I2C/GPIO×n
RK3568核心板 | NXN-CORE-3568-MXM-5282-V2

核心板

市场价:0.00

价格:0.00

Size：50×65mm SoC：Rockchip RK3568 CPU：Quad-core Cortex-A55 up to 2.0GHz GPU：Mali-G52 NPU：0.8TOPs RAM：2GB/4GB LPDDR4 ROM：16GB/32GB/64GB/128GB eMMC Decoder：4K 60FPS H.265/H.264/VP9 Encoder：1080P 100FPS H.265/H.264 Interface：HDMI OUT×1/MIPI DSI×2/LVDS×1/eDP×1；MIPI CSI×2；SATA3.0×1；USB3.0×2；USB2.0×2；PCIe3.0×1；G-Ethernet GMAC×2；SDIO3.0×2（for WIFI and SD）；I2S×1/Speaker×1/Mic×1/Hearphone×1；UART/SPI/I2C/GPIO×n
RV1126核心板 | NXN-CORE-1126-BTB-4045-V2

核心板

市场价:699.00

价格:699.00

RV1126核心板
一种多通道视频采集及拼接显示的应用程序

应用开发

市场价:20000.00

价格:2799.00

功能简介：该应用程序基于开源多媒体框架Gstreamer来实现多通道音视频采集、编码、解码、渲染、滤镜、截屏、录屏、直播推流、存储等功能，并可在屏幕指定区域输出指定视频源从而实现多路视频源拼接显示。 操作系统：Linux Bulidroot 硬件平台：NNEWN-RK3588开发板 开发语言：Python 3.10.5 开发工具：DJANGO 1.9.7 网络软件：PYCHARM 5.0.1
一种基于RK3588的通用型开发板

产品中心

市场价:20000.00

价格:2799.00

EVB-NSR3588B是一款基于NNEWN-NSR3588B核心板开发的支持8K视频的功能全面的高性能AI开发板。基于开箱即用的产品设计理念，EVB-NSR3588B开发板采用模块化设计理念，开发板由核心板+底板构成，核心板和底板之间通过高性能板对板连接器对接，即插即用，高度互换。另外我们还为该开发板适配了Android12、Debian11、Ubuntu20.04等产品级主流操作系统，而且支持KylinOS、UOS、OpenHarmony等国产操作系统适配。为了方便开发者快速入门，我们精心编写了非常详细实用的开发者入门指南，通过阅读该指南，您可以轻松地将您的应用程序移植到我们为您准备的稳健的硬件平台及操作系统上并快速完成功能验证及产品原型搭建。
物联网云平台

应用开发

市场价:0.00

价格:0.00