PerfXLab 澎峰科技

Discovering Potential. Driving Performance.




About Us


PerfXLab 澎峰科技是一家领先的嵌入式AI解决方案供应商,提供基于ARM/FPGA/GPU/RISC-V等终端平台的完整解决方案,包括应用算法、框架、性能库、硬件板卡等。应用领域包括:工业现场、安防和智慧社区、以及教育等。

公司核心技术成员来自麻省理工和中科院,具有丰富的底层计算技术经验。此外,我们支持开源社区,领导了国际知名开源矩阵库OpenBLAS,贡献了OpenCV项目的OpenCL GPU代码,为RISC-V社区提供了高性价比的Perf-V开发板。



PerfBLAS

PerfBLAS是针对ARM等嵌入式平台和深度学习应用优化的高性能BLAS库。

相比OpenBLAS,ARMv7和ARMv8架构的CPU的AlexNet模型性能提高一倍。

支持Linux和Android平台。


InferXLite

InferXLite是一款轻量级的嵌入式深度学习推理框架,支持ARM CPU,ARM Mali GPU,AMD APU SoC,以及NVIDIA GPU。

我们提供了转换工具,用以支持Caffe和Darknet模型文件格式,未来还将支持PyTorch和Tensorflow模型文件。

通过PerfDNN和PerfBLAS库的支持,InferXLite可以在嵌入式平台得到较高的推理性能。


PerfBox

PerfBox是一款64位ARM嵌入式板卡,主要应用于智能摄像头,人脸识别系统,新零售等领域。

通过InferXLite,PerfDNN和PerfBLAS的AI软件栈针对性优化,Squeezenet v1.1模型单线程可以达到87ms。


Perf-FPGA

Perf-FPGA是澎峰科技所研发的面向FPGA的AI方案,具有高性能,低功耗,环境适应性强等特点。可以进行人脸,行人,车辆等多种目标和物体检测与追踪,支持无人机、安防、教育科研等应用领域。

Perf-FPGA涵盖了深度神经网络算法压缩,定点量化以及根据FPGA部署平台的生成加速器。压缩与量化工具DL-Quants可以导入多种主流深度学习模型, DL-Compiler可以快速生成DL加速器和运行代码。DL-Accelerator采用RTL实现,底层针对不同平台做了适配和优化,使资源占用和性能达到极致。


Perf-APU

深度学习到AMD APU部署整体解决方案:

  • 卓越的计算性能:具有独立GPU级别性能的AMD APU SoC,配合独有的高性能深度学习推理框架和加速库,实现深度学习应用的实时响应
  • 较低的功耗:TDP 15W, 12-25W可配置
  • 较多的模型支持:支持多种深度学习模型框架转换,支持YOLO V3/V2, SSD类别网络
  • 多种扩展功能:提供图像预处理,目标识别与跟踪等多种扩展功能
  • 输入多支持:支持H.264/H.265视频,摄像头等多种输入方式
  • 提供软硬一体化的开发平台

Perf-V

Perf-V是一款高性价比的RISC-V的FPGA开发板,提供了丰富的接口、扩展板和demo案例。

Perf-V支持多种RISC-V开源Core,包括2流水和5流水的软核,支持arduino和PMOD等接口。我们提供了多种扩展板,包括HDMI扩展板,摄像头配件,sdcard扩展板,智能小车配件等,可以进行示波器,智能小车,wifi图传等demo开发。

在软件方面,我们提供了Perf-V集成开发环境,方便在Windows和Linux进行调试和开发工作。

购买链接:


高性能算法库和软件生态环境服务

包括:

  • OpenBLAS的移植,和针对客户硬件平台和应用特性的专门优化。
  • 针对客户硬件平台和应用,定制高性能算法库,包括BLAS、LAPACK、FFT、IPP库、计算机视觉库等。
  • 针对客户硬件平台,定制完整的深度学习环境,以及其他软件生态环境。
  • 针对客户应用,进行并行化和性能优化等。


加入我们


招聘职位包括:HPC高性能计算工程师(C/C++/性能优化),嵌入式Linux软件工程师,FPGA工程师,计算机视觉算法工程师

欢迎加入我们,全职或者实习生,简历请发送至 [email protected]


Stay In Touch: