PerfXLab 澎峰科技是一家国内领先的、专注于计算软件栈的技术公司,提供基于ARM/FPGA/GPU/RISC-V等终端平台的完整计算软件栈解决方案,包括应用算法、框架、高性能计算库、软件工具,以及相关硬件板卡等。应用领域:主要服务于计算硬件领域的行业大客户,以及通过开源理念发展开发者、爱好者和大学教育市场等。其公司核心技术成员来自麻省理工和中科院,具有丰富的底层计算技术经验。
我们领导了国际知名开源矩阵库OpenBLAS,贡献了OpenCV项目的OpenCL GPU代码,建设RISC-V社区提供高性价比的RVBoards开源硬件和软件。
PerfBLAS是针对ARM等嵌入式平台和深度学习应用优化的高性能BLAS库。
相比OpenBLAS,ARMv7和ARMv8架构的CPU的AlexNet模型性能提高一倍。
支持Linux和Android平台。
InferXLite是一款轻量级的嵌入式深度学习推理框架,支持ARM CPU,ARM Mali GPU,AMD APU SoC,以及NVIDIA GPU。
我们提供了转换工具,用以支持Caffe和Darknet模型文件格式,未来还将支持PyTorch和Tensorflow模型文件。
通过PerfDNN和PerfBLAS库的支持,InferXLite可以在嵌入式平台得到较高的推理性能。
PerfBox是一款64位ARM嵌入式板卡,主要应用于智能摄像头,人脸识别系统,新零售等领域。
通过InferXLite,PerfDNN和PerfBLAS的AI软件栈针对性优化,Squeezenet v1.1模型单线程可以达到87ms。
Perf-FPGA是澎峰科技所研发的面向FPGA的AI方案,具有高性能,低功耗,环境适应性强等特点。可以进行人脸,行人,车辆等多种目标和物体检测与追踪,支持无人机、安防、教育科研等应用领域。
Perf-FPGA涵盖了深度神经网络算法压缩,定点量化以及根据FPGA部署平台的生成加速器。压缩与量化工具DL-Quants可以导入多种主流深度学习模型, DL-Compiler可以快速生成DL加速器和运行代码。DL-Accelerator采用RTL实现,底层针对不同平台做了适配和优化,使资源占用和性能达到极致。
深度学习到AMD APU部署整体解决方案:
Perf-V是一款高性价比的RISC-V的FPGA开发板,提供了丰富的接口、扩展板和demo案例。
Perf-V支持多种RISC-V开源Core,包括2流水和5流水的软核,支持arduino和PMOD等接口。我们提供了多种扩展板,包括HDMI扩展板,摄像头配件,sdcard扩展板,智能小车配件等,可以进行示波器,智能小车,wifi图传等demo开发。
在软件方面,我们提供了Perf-V集成开发环境,方便在Windows和Linux进行调试和开发工作。
购买链接:
包括:
招聘职位包括:HPC高性能计算工程师(C/C++/性能优化),嵌入式Linux软件工程师,FPGA工程师,计算机视觉算法工程师
欢迎加入我们,全职或者实习生,简历请发送至 [email protected]