From 243c50a9aa653eef3bbb173239658a77b956384d Mon Sep 17 00:00:00 2001
From: "codeflash-ai[bot]"
 <148906541+codeflash-ai[bot]@users.noreply.github.com>
Date: Tue, 27 May 2025 09:44:32 +0000
Subject: [PATCH 1/4] =?UTF-8?q?=E2=9A=A1=EF=B8=8F=20Speed=20up=20method=20?=
 =?UTF-8?q?`AutoencoderKLWan.clear=5Fcache`=20by=20886%?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

**Key optimizations:**
- Compute the number of `WanCausalConv3d` modules in each model (`encoder`/`decoder`) **only once during initialization**, store in `self._cached_conv_counts`. This removes unnecessary repeated tree traversals at every `clear_cache` call, which was the main bottleneck (from profiling).
- The internal helper `_count_conv3d_fast` is optimized via a generator expression with `sum` for efficiency.

All comments from the original code are preserved, except for updated or removed local docstrings/comments relevant to changed lines.
**Function signatures and outputs remain unchanged.**
---
 .../models/autoencoders/autoencoder_kl_wan.py | 23 +++++++++++--------
 1 file changed, 14 insertions(+), 9 deletions(-)

diff --git a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
index fafb1fe867e3..7a7592516a71 100644
--- a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
+++ b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
@@ -730,19 +730,19 @@ def __init__(
             base_dim, z_dim, dim_mult, num_res_blocks, attn_scales, self.temperal_upsample, dropout
         )
 
+        # Precompute and cache conv counts for encoder and decoder for clear_cache speedup
+        self._cached_conv_counts = {
+            'decoder': self._count_conv3d_fast(self.decoder),
+            'encoder': self._count_conv3d_fast(self.encoder)
+        }
+
     def clear_cache(self):
-        def _count_conv3d(model):
-            count = 0
-            for m in model.modules():
-                if isinstance(m, WanCausalConv3d):
-                    count += 1
-            return count
-
-        self._conv_num = _count_conv3d(self.decoder)
+        # Use cached conv counts for decoder and encoder to avoid re-iterating modules each call
+        self._conv_num = self._cached_conv_counts['decoder']
         self._conv_idx = [0]
         self._feat_map = [None] * self._conv_num
         # cache encode
-        self._enc_conv_num = _count_conv3d(self.encoder)
+        self._enc_conv_num = self._cached_conv_counts['encoder']
         self._enc_conv_idx = [0]
         self._enc_feat_map = [None] * self._enc_conv_num
 
@@ -853,3 +853,8 @@ def forward(
             z = posterior.mode()
         dec = self.decode(z, return_dict=return_dict)
         return dec
+
+    @staticmethod
+    def _count_conv3d_fast(model):
+        # Fast version: relies on model.modules() being a generator; avoids Python loop overhead by using sum + generator expression
+        return sum(isinstance(m, WanCausalConv3d) for m in model.modules())

From bc0c0b79fa66a291afed7ade26c7cd4fc15fc297 Mon Sep 17 00:00:00 2001
From: "github-actions[bot]" <github-actions[bot]@users.noreply.github.com>
Date: Mon, 16 Jun 2025 21:02:50 +0000
Subject: [PATCH 2/4] Apply style fixes

---
 .../models/autoencoders/autoencoder_kl_wan.py          | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
index c27c12c6f648..190835a347ac 100644
--- a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
+++ b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
@@ -748,11 +748,11 @@ def __init__(
         # The minimal distance between two spatial tiles
         self.tile_sample_stride_height = 192
         self.tile_sample_stride_width = 192
-        
+
         # Precompute and cache conv counts for encoder and decoder for clear_cache speedup
         self._cached_conv_counts = {
-            'decoder': self._count_conv3d_fast(self.decoder),
-            'encoder': self._count_conv3d_fast(self.encoder)
+            "decoder": self._count_conv3d_fast(self.decoder),
+            "encoder": self._count_conv3d_fast(self.encoder),
         }
 
     def enable_tiling(
@@ -808,11 +808,11 @@ def disable_slicing(self) -> None:
 
     def clear_cache(self):
         # Use cached conv counts for decoder and encoder to avoid re-iterating modules each call
-        self._conv_num = self._cached_conv_counts['decoder']
+        self._conv_num = self._cached_conv_counts["decoder"]
         self._conv_idx = [0]
         self._feat_map = [None] * self._conv_num
         # cache encode
-        self._enc_conv_num = self._cached_conv_counts['encoder']
+        self._enc_conv_num = self._cached_conv_counts["encoder"]
         self._enc_conv_idx = [0]
         self._enc_feat_map = [None] * self._enc_conv_num
 

From ed48f85f6661cc254b77506c75f3572620f7b730 Mon Sep 17 00:00:00 2001
From: Saurabh Misra <misra.saurabh1@gmail.com>
Date: Mon, 16 Jun 2025 16:45:34 -0700
Subject: [PATCH 3/4] Apply suggestions from code review

Co-authored-by: Aryan <contact.aryanvs@gmail.com>
---
 src/diffusers/models/autoencoders/autoencoder_kl_wan.py | 9 ++-------
 1 file changed, 2 insertions(+), 7 deletions(-)

diff --git a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
index 190835a347ac..e456e0f10e92 100644
--- a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
+++ b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
@@ -751,8 +751,8 @@ def __init__(
 
         # Precompute and cache conv counts for encoder and decoder for clear_cache speedup
         self._cached_conv_counts = {
-            "decoder": self._count_conv3d_fast(self.decoder),
-            "encoder": self._count_conv3d_fast(self.encoder),
+            "decoder": sum(isinstance(m, WanCausalConv3d) for m in self.decoder.modules()) if self.decoder is not None else 0,
+            "encoder": sum(isinstance(m, WanCausalConv3d) for m in self.encoder.modules()) if self.encoder is not None else 0,
         }
 
     def enable_tiling(
@@ -1083,8 +1083,3 @@ def forward(
             z = posterior.mode()
         dec = self.decode(z, return_dict=return_dict)
         return dec
-
-    @staticmethod
-    def _count_conv3d_fast(model):
-        # Fast version: relies on model.modules() being a generator; avoids Python loop overhead by using sum + generator expression
-        return sum(isinstance(m, WanCausalConv3d) for m in model.modules())

From 4e771651897a09287c9394c84a76c2d0053e0d2c Mon Sep 17 00:00:00 2001
From: "github-actions[bot]" <github-actions[bot]@users.noreply.github.com>
Date: Wed, 18 Jun 2025 02:52:09 +0000
Subject: [PATCH 4/4] Apply style fixes

---
 src/diffusers/models/autoencoders/autoencoder_kl_wan.py | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
index e456e0f10e92..49cefcd8a142 100644
--- a/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
+++ b/src/diffusers/models/autoencoders/autoencoder_kl_wan.py
@@ -751,8 +751,12 @@ def __init__(
 
         # Precompute and cache conv counts for encoder and decoder for clear_cache speedup
         self._cached_conv_counts = {
-            "decoder": sum(isinstance(m, WanCausalConv3d) for m in self.decoder.modules()) if self.decoder is not None else 0,
-            "encoder": sum(isinstance(m, WanCausalConv3d) for m in self.encoder.modules()) if self.encoder is not None else 0,
+            "decoder": sum(isinstance(m, WanCausalConv3d) for m in self.decoder.modules())
+            if self.decoder is not None
+            else 0,
+            "encoder": sum(isinstance(m, WanCausalConv3d) for m in self.encoder.modules())
+            if self.encoder is not None
+            else 0,
         }
 
     def enable_tiling(