腾讯优图ncnn新版本适配国产CPU，最高速度提升70倍

2021 年 7 月 23 日
AI
目标检测

随着自主信息技术创新应用的持续推进，国产PC、国产OS和软硬件设备日趋成熟。为了更好的助力国产CPU在AI软件生态从“可用”到“好用”，作为腾讯优图实验室推出的首个高性能神经网络前向计算开源框架，ncnn近期在国产CPU龙芯和D1上进行了较为全面的适配和性能优化，ncnn携手龙芯和全志科技，共同打通了AI应用和国产CPU硬件间的壁垒。

龙芯

是中国科学院计算所自主研发的通用CPU，采用自主LoongISA指令系统，兼容MIPS指令

是全志科技首款基于RISC-V指令集的芯片，集成了阿里平头哥64位C906核心，支持RVV

本次ncnn更新的20210720版本，完成了risc-v与mips架构cpu的适配，并利用risc-v vector与mips msa矢量加速扩展指令集，优化了绝大多数常用算子的性能。在ncnn附带的benchmark测试中，ncnn在龙芯CPU上速度提升最高18.64倍，在D1上速度提升最高70倍，满足了AI端侧推理部署的基本需求。