検証結果。Sakana:オリジナルのコード、Improved:元のコードをを正しく動作するように修正したバージョン、Gemini:別の最適化を試みたバージョン、Gemini2:Geminiバージョンに共有メモリとCooperative Groupsを使った最適化を追加したバージョン、Gemini3:意図的に“盗み見”を行うように改変したバージョン、PyTorch:PyTorchの組み込み関数(torch.matmulと.tril())を使用した実装

検証結果。Sakana:オリジナルのコード、Improved:元のコードをを正しく動作するように修正したバージョン、Gemini:別の最適化を試みたバージョン、Gemini2:Geminiバージョンに共有メモリとCooperative Groupsを使った最適化を追加したバージョン、Gemini3:意図的に“盗み見”を行うように改変したバージョン、PyTorch:PyTorchの組み込み関数(torch.matmulと.tril())を使用した実装