2024-08-02から1日間の記事一覧

DatabricksでLlama3.1 70BのマルチGPU推論を行う

AI Databricks

はじめにこんにちは。テックラボの高橋です。本記事ではDatabricks上でLlama3.1のマルチGPU推論ができるかどうか試していきます。 8Bのモデルだと16G 1枚で実行できてしまうので、あえて70Bのモデルに挑戦してみます。 ※モデル毎の速度比較については下記…