PRODUCT

AMD XILINX VCK5000

AI Inference Development Card

AMD XILINX VCK5000 Versal 開発カードは業界標準 AIベンチマークで世界初のゼロダークシリコン(ワットあたりの計算効率がほぼ 100%)を達成し、NVIDIA社の主力 GPUと比較して 2倍の費用対効果を提供する VCK5000は、ラックマウントサーバやワークステーションでの CNN、RNN、NLPアクセラレーションに最適な開発プラットフォームです。

AMD XILINX VCK5000 仕様

カードの仕様 VCK5000
デバイス VC1902
コンピューティング アクティブ パッシブ
INT8 TOPS (ピーク) 145 145
サイズ 高さ フル フル
長さ フル 3/4
デュアル スロット デュアル スロット
メモリ DDR メモリ容量 16 GB 16 GB
DDR 総帯域幅 102.4 GB/s 102.4 GB/s
内部 SRAM の容量 23.9 MB 23.9 MB
内部 SRAM の総帯域幅 23.5 TB/s 23.5 TB/s
インターフェイス PCI Express 43MB 57MB
ネットワーク インターフェイス 37TB/s 47TB/s
ロジック リソース ルックアップ テーブル (LUT) 899,840 899,840
消費電力と熱 最大総消費電力 225W 225W
熱冷却 アクティブ パッシブ

※アクティブファンは取り外し式です。

AI 推論

2倍の TCO削減(主流の GPUと比較)

  • ワットあたり性能と価格性能比は 2倍(NVIDIA Ampereと比較)
  • 90%の計算効率を達成
  • 消費電力は 100W以下(カードレベル)

エンドツーエンドのビデオ解析スループットは NVIDIA GPUの 2倍

  • H.264デコードからコンピュータービジョンまで、最大 10個の AIモデルでフルパイプラインを実装
  • x86 CPUまたは単一の U30 Alveoカードでビデオデコードと CVを実行
  • FFmpeg / Gstreamerを使用するプラグインのパイプライン設計

ML Heavy: H.264 Decode + Yolov3 + 3x ResNet-18
Video Heavy: H.264 Decode + tinyYolov3 + 3x ResNet-50

使い慣れたフレームワークで作業が簡単

  • ハードウェアプログラミングが不要な CPU / GPUユーザー向けのソフトウェアフロー
  • TensorFlowフレームワークを使用してボードで直接推論を実行
  • 主要フレームワーク(Pytorch、TensorFlow、TensorFlow 2、Caffe)でサポートされる最先端モデル

包括的なサポート

AI 開発者の方 学習済みの TensorFlow/Pytorch モデルを、Vitis AI や Mipsology Zebra で使用して Versal 上で直接推論を実行。
AI エンジンとプログラマブルロジックでアルゴリズムの高速化を希望される方 C/C++ を使用する抽象度の高い AI エンジン API と Vitis アクセラレーションライブラリを提供。
Vitis フロー ・X86 またはエンベデッドプロセッサで実行。
・XRT でアクセラレータとの実行時の相互作用を管理。
ハードウェアコンポーネントやカーネルは、C/C++ で開発することも、PL や AI エンジンに対して RTL を使用して開発することも可能。

AMD XILINX サポートページリンク

https://support.xilinx.com/s/global-search/VCK5000?language=en_US

AMD XILINX VCK5000 Product Brief

Accelerating Deep Learning Models on Xilinx 7nm Versal Card

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。