第一生活网

FPGA 演示显示与 x86 芯片相比的效率提升

成永雪
导读 FPGA - 这是一种现场可编程的门阵列,一种可重新配置的微芯片 - 已被证明可以运行用C编写的3D射线追踪游戏,其效率比x86 CPU高50倍,

FPGA - 这是一种现场可编程的门阵列,一种可重新配置的微芯片 - 已被证明可以运行用C编写的3D射线追踪游戏,其效率比x86 CPU高50倍,同时使用一小部分能量,并可能为未来的编程效率提升指明道路。这些声明在白皮书中提出 [PDF(在新选项卡中打开)]由来自阿根廷的开发人员维克多·苏亚雷斯·罗维尔和来自宾夕法尼亚州的系统工程师朱利安·凯默勒撰写,并由CNX软件引起我们的注意(在新选项卡中打开).

现场可编程门阵列(在新选项卡中打开)有问题的是艺术A7(在新选项卡中打开),Xilinx Artix-7 100T FPGA 开发板售价约为 280 美元,在 28 纳米工艺上具有 101,440 个逻辑单元(FPGA 的逻辑单元包含一个可实现任何逻辑功能的查找表,使芯片具有可编程性),功耗不到 1 瓦。它所对抗的CPU(必须说,没有困扰芯片的iGPU)是Ryzen 7 4800H,这是一款基于7纳米工艺构建的八核16线程笔记本电脑处理器,默认TDP为45W。这是一款笔记本电脑芯片,无法单独使用,但R7 4700G目前售价约为240美元。

被编译为在两个截然不同的平台上运行的游戏是“Sphery Vs Shapes”,似乎不包含太多情节,角色或实际游戏玩法,但确实有很多光线追踪,因为一个闪亮的金属球在棋盘般的环境中反弹,这反映在其闪亮的球形表面上。

两个平台都以1080p和每秒50帧的速度渲染游戏,没有问题,但FPGA使用660 mW,而R7需要35W,相差53倍。据推测,如果FPGA使用与CPU相同的7nm工艺,这个数字可能会高出六倍。

整个事情的关键是管道C(在新选项卡中打开),凯默勒和CflexHDL的发明(在新选项卡中打开)来自苏亚雷斯。你可以在 GitHub 上找到它们。“游戏的像素渲染和动画逻辑基于浮点和矢量数学运算。所有游戏代码都使用直接转换为数字电路的干净语法表示。该设计的当前目标是具有全高清数字视频输出的FPGA板,并且该工作流程还允许使用未经修改的源在常规PC上实时运行游戏,“他们在论文中写道。“与传统的硬件设计工具相比,这允许更快的开发测试迭代。对于相同的工作负载,计算效率比使用现代CPU高出50倍以上,芯片要小一个数量级。