AMD XILINX VCK5000

トップ
GPU・FPGA・Accelerator
AMD XILINX VCK5000

GPU・FPGA・Accelerator

AI Inference Development Card

AMD XILINX VCK5000 Versal 開発カードは業界標準 AIベンチマークで世界初のゼロダークシリコン（ワットあたりの計算効率がほぼ 100%）を達成し、NVIDIA社の主力 GPUと比較して 2倍の費用対効果を提供する VCK5000は、ラックマウントサーバやワークステーションでの CNN、RNN、NLPアクセラレーションに最適な開発プラットフォームです。

AMD XILINX VCK5000 仕様

カードの仕様		VCK5000
デバイス		VC1902
コンピューティング		アクティブ	パッシブ
INT8 TOPS (ピーク)		145	145
サイズ	高さ	フル	フル
	長さ	フル	3/4
	幅	デュアルスロット	デュアルスロット
メモリ	DDR メモリ容量	16 GB	16 GB
	DDR 総帯域幅	102.4 GB/s	102.4 GB/s
	内部 SRAM の容量	23.9 MB	23.9 MB
	内部 SRAM の総帯域幅	23.5 TB/s	23.5 TB/s
インターフェイス	PCI Express	43MB	57MB
インターフェイス	ネットワークインターフェイス	37TB/s	47TB/s
ロジックリソース	ルックアップテーブル (LUT)	899,840	899,840
消費電力と熱	最大総消費電力	225W	225W
消費電力と熱	熱冷却	アクティブ	パッシブ

※アクティブファンは取り外し式です。

AI 推論

2倍の TCO削減（主流の GPUと比較）

ワットあたり性能と価格性能比は 2倍（NVIDIA Ampereと比較）
90%の計算効率を達成
消費電力は 100W以下（カードレベル）

エンドツーエンドのビデオ解析スループットは NVIDIA GPUの 2倍

H.264デコードからコンピュータービジョンまで、最大 10個の AIモデルでフルパイプラインを実装
x86 CPUまたは単一の U30 Alveoカードでビデオデコードと CVを実行
FFmpeg / Gstreamerを使用するプラグインのパイプライン設計

ML Heavy: H.264 Decode + Yolov3 + 3x ResNet-18
Video Heavy: H.264 Decode + tinyYolov3 + 3x ResNet-50

使い慣れたフレームワークで作業が簡単

ハードウェアプログラミングが不要な CPU / GPUユーザー向けのソフトウェアフロー
TensorFlowフレームワークを使用してボードで直接推論を実行
主要フレームワーク（Pytorch、TensorFlow、TensorFlow 2、Caffe）でサポートされる最先端モデル

包括的なサポート

AI 開発者の方	学習済みの TensorFlow/Pytorch モデルを、Vitis AI や Mipsology Zebra で使用して Versal 上で直接推論を実行。
AI エンジンとプログラマブルロジックでアルゴリズムの高速化を希望される方	C/C++ を使用する抽象度の高い AI エンジン API と Vitis アクセラレーションライブラリを提供。
Vitis フロー	・X86 またはエンベデッドプロセッサで実行。・XRT でアクセラレータとの実行時の相互作用を管理。ハードウェアコンポーネントやカーネルは、C/C++ で開発することも、PL や AI エンジンに対して RTL を使用して開発することも可能。