

ディープ・ラーニング・スーパー・サンプリング英語: Deep learning super sampling(DLSS))は、NVIDIAによって開発され、一部のビデオゲームでリアルタイムに使用するためのNvidiaグラフィックカード専用英語版の画像アップスケーリングテクノロジーである。本項では略称である『DLSS』を用いて記述する。





2025年2月の時点で、このテクノロジーはGeForce RTX 20GeForce RTX 30GeForce RTX 40GeForce RTX 50シリーズGPUでのみ利用可能である。



NVIDIAは、2018年9月に発売されたGeForce RTX20シリーズGPUの主要機能としてDLSSを追加した[3]。当時は、限られた少数のゲームタイトル(『バトルフィールドV [4]』と『メトロエクソダス』)においてのみ対応されていた。またアルゴリズムを対応された各ゲームで個別に調整する必要があり、平時の効果は単純な解像度のアップスケーリングと比較して大きな差はなかった[5][6]


2020年4月、NVIDIAはドライバーバージョン445.75を提供し、DLSS 2.0へのバージョンアップが行われた。これは前述の『コントロール』『ウルフェンシュタイン:ヤングブラッド英語版』などのいくつかの既存のゲームで利用でき、今後発売されるゲームでも対応し利用可能になるとしている。2.0ではTensor Coreを再び使用することでAI学習データを用いる事で、初期のバージョンで必要だった各ゲーム毎での個別調整する必要はなくなった[3][9]。ただし、ゲーム側の対応と実装は引き続き個別に必要となる。


2022年12月に3.0がリリース、通常のレンダリングと比べて性能が最大で4倍増、更に従来のアップスケールに加えてオプティカルマルチフレーム生成機能が追加された。また、CPUがボトルネックとなっていてもフレームレートを高めることが可能となる。レイテンシを軽減するためにNVIDIA Reflexが搭載。フレーム生成機能はGeForce RTX 40シリーズのみで対応しており[12]、アップスケーリング機能は従来のGeForce RTX 20・RTX 30シリーズでにも対応している。

2023年9月に3.5がリリース、「Ray Reconstruction(光線再構築)」と呼ばれる新技術が追加[13]され、この機能はRTX 20シリーズからRTX 30を含めた全てのRTXシリーズに対応する。


バージョン リリース月 概要
1.0 2019年2月 AIを使用し、バトルフィールドVメトロエクソダスなどの特定のゲーム用に特別に調整された最初のバージョン[4]
2.0(最初の実装) 2019年8月 CUDAシューダーコアで実行され、特にコントロールに適合した進行中のバージョン2.0の近似AIを使用する。バージョン1.9とも呼ばれる最初の2.0バージョン[7][3][14]
2.0(2回目の実装) 2020年4月 Tensor Coreを再度使用し、一般的に調整された2番目の2.0バージョン[15]で、4段階のゲーム画質設定モードが実装された。
2.3 2021年11月 動きの激しい場面で発生するゴーストを、モーションベクトルをより高度に利用するよう改善したことで軽減に成功したとしている[11]
3.0 2022年10月 DLSS超解像、全く新しいDLSSフレーム生成、NVIDIA Reflexを組み合わせたバージョン[12]
3.1 2023年1月 2023年8月の3.5発表時にリリース済みである事が明かされたマイナーアップデートバージョンで詳細不明[13]
3.5 2023年9月 「Ray Reconstruction(光線再構築)」と呼ばれる新技術が追加[13]され、この機能はRTX 20シリーズからRTX 30を含めた全てのRTXシリーズに対応する。
4.0 2025年1月 RTX 50シリーズのみで利用可能となる「DLSS マルチフレーム生成」機能が追加された。フレームレートの大幅な向上を謳っている[16][17]


品質プリセット[注釈 1] スケールファクター[注釈 2] レンダリングスケール[注釈 3]
クオリティ 1.50x 66.6%
バランス 1.72x 58.0%
パフォーマンス 2.00x 50.0%
ウルトラパフォーマンス(v2.1以降) 3.00x 33.3%
  1. ^ アルゴリズムは必ずしもこれらのプリセットを使用して実装する必要はなく、実装者がカスタムの入力および出力解像度を定義することも可能。
  2. ^ 入力解像度を出力解像度にアップサンプリングする際に使用されるスケールファクターのこと。例えば、540pでレンダリングされたシーンを2.00xのスケールファクターで表示すると、出力解像度は1080pになる。
  3. ^ アップサンプリングの前に内部でシーンをレンダリングする際に使用される、出力解像度と比較したレンダリングスケールのこと。例えば、1080pのシーンを50%のレンダリングスケールでレンダリングした場合、内部解像度は540pになる。



DLSS 1.0


NVIDIAはDLSS 1.0について、従来のスーパーサンプリングを使用して「完璧なフレーム」を生成することで、各ゲーム画像毎にニューラルネットワークで学習する必要があると説明した。 2番目のステップでは、初期結果でアンチエイリアシングやVRSといった映像処理をAIの処理に任せるという調整がなされた[19][20]

DLSS 2.0[21]

  • ニューラルネットワークは、スーパーコンピューターでの超高解像度のビデオゲームの「理想的な」画像と同じゲームの低解像度画像を使用して、NVIDIAによって学習され、ビデオカードドライバに保存される。 NVIDIAはDEX-1英語版サーバーを使用してネットワークのトレーニングを実行すると言われている[22]
  • ドライバーに保存されているニューラルネットワークは、実際の低解像度画像を参照と比較し、完全な高解像度の結果を生成するもの。調整されたニューラルネットワークによって使用される入力は、ゲームエンジンによってレンダリングされた低解像度のエイリアス画像と、同じくゲームエンジンによって生成された同じ画像からの低解像度の動きベクトルである。モーションベクトルは、次のフレームがどのように見えるかを推定するために、シーン内のオブジェクトがフレーム間を移動している方向をネットワークに通知している[23]

DLSS 3.0[12]

  • 全く新しいフレームを生成するオプティカルマルチフレーム生成を追加し、最適な応答性を実現するNVIDIA Reflex低遅延技術を統合している。
  • DLSS フレーム生成畳み込みオートエンコーダーは、現在と前のゲームのフレーム、オプティカルフローアクセラレータで生成されたオプティカルフローフィールド、モーションベクターや深度などのゲームエンジンのデータの4つの入力を受け取る。アクセラレータは、連続した2つのゲーム内フレームを解析しフローフィールドを計算、フレーム1からフレーム2へピクセルが移動する方向と速度を捉える。
  • アクセラレータは、ゲーム エンジンのモーションベクター計算には含まれないパーティクル、リフレクション、シャドウ、ライティングなどのピクセルレベルの情報を取得することが可能であるとしている。



DLSSは、GeForce RTXシリーズのGPUで、Tensor Coresと呼ばれる専用の AIアクセラレータでのみ使用できる[23][26]

Tensor Coreは、Tesla V100の製品ラインで最初に使用されたNVIDIA Volta英語版 GPUマイクロアーキテクチャ以降に利用可能[27]。それらの特異性は、各Tensorコアが16ビット浮動小数点4 x 4マトリックスで動作し、コンパイラレベルでもCUDA C ++レベルで使用されるように設計されているように見えることである[28]

Tensor Coreは、32の並列スレッドでCUDA ワープレベルプリミティブを使用して、並列アーキテクチャを活用する[29]。ワープは、同じ命令を実行するように構成された32スレッドのセットである。

3.0はNVIDIA Ada Lovelaceアーキテクチャの新しい第4世代Tensor Coreとオプティカルフローアクセラレータによってのみ動作する。




