关于我们/ about us

  • 2016年中国计算机学会科技进步二等奖
  • 2016年全国移动互联创新大赛高校组教学成果一等奖
  • 2016年大数据产业应用创新黑马企业
  • 2016年中国大数据技术大会突出贡献奖
  • 2016年中国通信学会移动创新“黑科技”奖
  • 2016年中国计算机学会CCF年度科学技术二等奖
  • 2017新智元创业大赛TOP10AI创业公司
  • 2017年中国科学院杰出科技成就奖
  • 中关村高新技术企业认证
  • 中关村金种子企业认证

产品介绍/ PRODUCT

01嵌入式深度学习开发平台PerfBox
PerfBOX是PerfXLab开发的一款顶级嵌入式深度学习开发平台,采用六核64位ARM处理器,并集成ARM Mali-T860四核GPU,并拥有2GB/4GB DDR3和16G/32GB的eMMC,性能强大,是一款学习、开发、部署深度学习应用的完美平台。
PerfBOX特点:
性能强大,采用六核64位ARM处理器以及ARM Mali-T860四核GPU,满足深度学习Inference阶段的需求
开发简单,PerfBOX预装本公司开发的嵌入式深度学习框架InferXLite,可部署深度学习应用
CPU+GPU处理器研发的高性能深度学习算法库PerfDNN_CL(支持fp16),可充分发挥硬件平台的计算能力
支持场景多样化,支持Android和Unbuntu双系统,满足不同场景需求
丰富的外部接口,提供了DP1.2、PCIe M.2、USB3.0 、Type-C、千兆以太网、HDMI视频接口等丰富的外部接口,以便用户拓展。
02轻量级深度学习推理框架InferXLite
目前在业内,通用框架有很多诟病:可执行文件过大>2MB,代码的耦合度比较高,不利于硬件平台的扩展,框架设计和性能优化组件往往会纠缠在一起,依赖库比较多,不利于开发测试。InferXLite是嵌入式AI整体解决方案中的轻量级深度学习专用框架,相较于传统框架而言有很多优势。
InferXLite特点:
●小(<100K),组织松散,特别适用于移动嵌入式设备。
●纯C开发,可移植任何硬件平台。
●无依赖库
●框架设计和性能加速分离
●性能卓越,框架层面对与算法加速也极尽考虑。
03深度学习优化矩阵计算库PerfBLAS
PerBLAS是嵌入式AI整体解决方案的核心组件之一,专注于深度学习的计算加速,相较于OpenBLAS,PerfBLAS针对ARM等嵌入式平台进行深度学习卷积算法优化,性能远优于OpenBLAS。PerfBLAS可广泛用于移动平台,手机、机器人、无人机等领域。
测试平台:ARM Cortex A57(1.7GHz)、ARM Cortex A57(1.7GHz)、ARM Cortex A15(2.32GHz )。测试网络为:AlexNet、VGG16、10层DNN网络模型(图像类应用)。
04深度神经网络计算库PerfDNN
PerfDNN是一个跨平台、高性能的轻量级深度学习算法库,实现了深度神经网络的核心算法,并向上提供了统一的用户接口,可非常便捷的集成到Caffe、DarkNet、InferXLite等深度学习框架中。
测试平台:Rk3399(1.8GHz),测试网络为:VGG16、VGG19、Resnet_50、Resnet_101。
05高性能计算机视觉库PerfCV
PerfCV是一个面向深度学习的可跨平台高性能计算机视觉库,实现了深度学习中主要的图像预处理算法,包括cvtColor、resize、warm_affine、warm_perspective等,PerfCV可在GPU、x86、ARM等多个硬件平台上实现高性能。
PerfCV特点: 跨平台:支持GPU、x86、ARM V7、ARM V8等多个平台。
高性能:在不同平台上,性能均优于OpenCV
高度定制:可根据用户需求,针对实际应用场景进行高度定制。
测试平台:ARM Cortex A15
06Perf-V工程板
Perf-V Model I 工程板是澎峰科技为RISC-V开源社区设计的FPGA开发板,集成了各种外设新品啊,提供多种接口,具备强大的灵活性,成功的移植了多种RISC-V处理器架构,并配备了丰富的学习资料,为RISC-V处理器设计和FPGA产品开发提供了良好的实验平台,是学习、科研、项目开发、DEMO方案的首选硬件。
07深度神经网络自动量化工具DL-Quants
目前深度神经网络的量化是嵌入式系统移植过程中非常重要的工作,其重要性不亚于单纯的性能优化。相比于浮点运算,定点运算对于存储和计算资源的占用更小、功耗更低、执行效率更高。传统的定点化工程师,需要针对数据特点,手动的去测试得到量化方案。而当前大多数十层的神经网络已无法采用以前传统的量化方案来解决。采用传统方式往往会带来难以预料的最终识别精度损失,且量化过程与结果都难以追溯和评估,量化的开发周期长,实现复杂,时间成本、人力成本都很高。

澎峰科技针对卷积神经网络,面向FPGA、嵌入式ARM等诸多嵌入式平台,推出了一套定点自动化软件DeepLearning-Quants(简称DL-Quants),已实现神经网络量化方案的自动生成。

◎ 深度神经网络量化最优方案的自动生成,无需人工参与。
◎ 神经网络计算流可根据导入的标准文件(prototxt)自动生成,无需添加代码。
◎ 量化参数全控制,量化模式自由定义,客户可根据需要自行决定量化宽度。
◎ 软件量化评估结果与FPGA等硬件实现的结果bit级一致。
◎ 检测结果与误差分析可视化,支持逐层结果对比评估,任意中间数据输出。
◎ 人性化的UI界面,支持Windows/Linux等系统,可跨平台使用。

产品介绍/ PRODUCT

01嵌入式深度学习开发平台PerfBox
PerfBOX是PerfXLab开发的一款顶级嵌入式深度学习开发平台,采用六核64位ARM处理器,并集成ARM Mali-T860四核GPU,并拥有2GB/4GB DDR3和16G/32GB的eMMC,性能强大,是一款学习、开发、部署深度学习应用的完美平台。
PerfBOX特点:
性能强大,采用六核64位ARM处理器以及ARM Mali-T860四核GPU,满足深度学习Inference阶段的需求
开发简单,PerfBOX预装本公司开发的嵌入式深度学习框架InferXLite,可部署深度学习应用
CPU+GPU处理器研发的高性能深度学习算法库PerfDNN_CL(支持fp16),可充分发挥硬件平台的计算能力
支持场景多样化,支持Android和Ubuntu双系统,满足不同场景需求
丰富的外部接口,提供了DP1.2、PCIe M.2、USB3.0 、Type-C、千兆以太网、HDMI视频接口等丰富的外部接口,以便用户拓展。
02轻量级深度学习推理框架InferXLite
目前在业内,通用框架有很多诟病:可执行文件过大>2MB,代码的耦合度比较高,不利于硬件平台的扩展,框架设计和性能优化组件往往会纠缠在一起,依赖库比较多,不利于开发测试。InferXLite是嵌入式AI整体解决方案中的轻量级深度学习专用框架,相较于传统框架而言有很多优势。
InferXLite特点:
●小(<100K),组织松散,特别适用于移动嵌入式设备。
●纯C开发,可移植任何硬件平台。
●无依赖库
●框架设计和性能加速分离
●性能卓越,框架层面对与算法加速也极尽考虑。
03深度学习优化矩阵计算库PerfBLAS
PerBLAS是嵌入式AI整体解决方案的核心组件之一,专注于深度学习的计算加速,相较于OpenBLAS,PerfBLAS针对ARM等嵌入式平台进行深度学习卷积算法优化,性能远优于OpenBLAS。PerfBLAS可广泛用于移动平台,手机、机器人、无人机等领域。
测试平台:ARM Cortex A57(1.7GHz)、ARM Cortex A57(1.7GHz)、ARM Cortex A15(2.32GHz )。测试网络为:AlexNet、VGG16、10层DNN网络模型(图像类应用)。
04深度神经网络计算库PerfDNN
PerfDNN是一个跨平台、高性能的轻量级深度学习算法库,实现了深度神经网络的核心算法,并向上提供了统一的用户接口,可非常便捷的集成到Caffe、DarkNet、InferXLite等深度学习框架中。
测试平台:Rk3399(1.8GHz),测试网络为:VGG16、VGG19、Resnet_50、Resnet_101。
05高性能计算机视觉库PerfCV
PerfCV是一个面向深度学习的可跨平台高性能计算机视觉库,实现了深度学习中主要的图像预处理算法,包括cvtColor、resize、warm_affine、warm_perspective等,PerfCV可在GPU、x86、ARM等多个硬件平台上实现高性能。
PerfCV特点: 跨平台:支持GPU、x86、ARM V7、ARM V8等多个平台。
高性能:在不同平台上,性能均优于OpenCV
高度定制:可根据用户需求,针对实际应用场景进行高度定制。
测试平台:ARM Cortex A15
06Perf-V工程板
Perf-V Model I 工程板是澎峰科技为RISC-V开源社区设计的FPGA开发板,集成了各种外设新品啊,提供多种接口,具备强大的灵活性,成功的移植了多种RISC-V处理器架构,并配备了丰富的学习资料,为RISC-V处理器设计和FPGA产品开发提供了良好的实验平台,是学习、科研、项目开发、DEMO方案的首选硬件。
07深度神经网络自动量化工具DL-Quants
目前深度神经网络的量化是嵌入式系统移植过程中非常重要的工作,其重要性不亚于单纯的性能优化。相比于浮点运算,定点运算对于存储和计算资源的占用更小、功耗更低、执行效率更高。传统的定点化工程师,需要针对数据特点,手动的去测试得到量化方案。而当前大多数十层的神经网络已无法采用以前传统的量化方案来解决。采用传统方式往往会带来难以预料的最终识别精度损失,且量化过程与结果都难以追溯和评估,量化的开发周期长,实现复杂,时间成本、人力成本都很高。

澎峰科技针对卷积神经网络,面向FPGA、嵌入式ARM等诸多嵌入式平台,推出了一套定点自动化软件DeepLearning-Quants(简称DL-Quants),已实现神经网络量化方案的自动生成。

◎ 深度神经网络量化最优方案的自动生成,无需人工参与。
◎ 神经网络计算流可根据导入的标准文件(prototxt)自动生成,无需添加代码。
◎ 量化参数全控制,量化模式自由定义,客户可根据需要自行决定量化宽度。
◎ 软件量化评估结果与FPGA等硬件实现的结果bit级一致。
◎ 检测结果与误差分析可视化,支持逐层结果对比评估,任意中间数据输出。
◎ 人性化的UI界面,支持Windows/Linux等系统,可跨平台使用。

联系我们/CONTACT

加入我们
HPC高性能计算 1、国内外名校计算机、电子、自动化类专业硕士及以上学历;
2、3年以上金融高频交易系统者开发经验;
3、熟悉C++ 和Linux系统架构,了解CPU基本运作原理、pipeline、指令、cache等
4、精通数据结构和算法原理,,熟悉socket和TCP/IP开发,熟悉函数式编程;
5、有高性能应用系统以及有计算密集型系统经验者优先。
FPGA工程师 1. 电子、通信、自动化等相关专业,本科毕业2年以上;
2. 熟悉 FPGA 的开发流程,从事过Xilinx、Alterax等主流FPGA的开发;
3. 具有Verilog或VHDL进行逻辑电路设计编程经验;
4. 掌握ISE和Quartus开发工具进行综合布局布线;
5. 熟练使用逻辑分析仪、示波器等测试设备进行调试和测试。
计算机视觉工程师 1.掌握计算机视觉领域的基础理论和算法
2.图像处理、三维重建或图像拼接、深度学习,至少精通其中一项
3.精通C/C++,熟悉Linux开发调试环境,能快速实现算法
4.有图像算法相关研发经验者优先
5.具备良好的团队合作和沟通能力,很强的逻辑思维能力和学习能力
    联系我们
  • PerfXLab澎峰科技 Discovering Potential. Driving Performance.
  • 邮编 100191
  • 地址 北京市海淀区知春路6号锦秋国际大厦A座1502



CopyRight© 2018 PerfXLab. All rights reserved.