NVIDIA
diff --git a/‎modelopt/torch/sparsity/__init__.py‎
Lines changed: 8 additions & 3 deletions b/‎modelopt/torch/sparsity/__init__.py‎
Lines changed: 8 additions & 3 deletions
diff --git a/‎modelopt/torch/sparsity/weight_sparsity/__init__.py‎
Lines changed: 23 additions & 0 deletions b/‎modelopt/torch/sparsity/weight_sparsity/__init__.py‎
Lines changed: 23 additions & 0 deletions
diff --git a/‎modelopt/torch/sparsity/config.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/config.py‎ b/‎modelopt/torch/sparsity/config.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/config.py‎
diff --git a/‎modelopt/torch/sparsity/magnitude.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/magnitude.py‎ b/‎modelopt/torch/sparsity/magnitude.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/magnitude.py‎
diff --git a/‎modelopt/torch/sparsity/mode.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/mode.py‎ b/‎modelopt/torch/sparsity/mode.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/mode.py‎
diff --git a/‎modelopt/torch/sparsity/module.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/module.py‎ b/‎modelopt/torch/sparsity/module.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/module.py‎
diff --git a/‎modelopt/torch/sparsity/plugins/__init__.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/plugins/__init__.py‎ b/‎modelopt/torch/sparsity/plugins/__init__.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/plugins/__init__.py‎
diff --git a/‎modelopt/torch/sparsity/plugins/megatron.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/plugins/megatron.py‎ b/‎modelopt/torch/sparsity/plugins/megatron.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/plugins/megatron.py‎
diff --git a/‎modelopt/torch/sparsity/searcher.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/searcher.py‎ b/‎modelopt/torch/sparsity/searcher.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/searcher.py‎
diff --git a/‎modelopt/torch/sparsity/sparsegpt.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/sparsegpt.py‎ b/‎modelopt/torch/sparsity/sparsegpt.py‎ renamed to ‎modelopt/torch/sparsity/weight_sparsity/sparsegpt.py‎
@@ -13,7 +13,12 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-"""API for sparsification algorithms."""
+"""API for sparsification algorithms.
 
-from . import mode, module, plugins
-from .sparsification import *
+This module provides access to both weight sparsity and attention sparsity algorithms.
+For backward compatibility, weight sparsity APIs are re-exported at the module level.
+"""
+
+# Import weight sparsity for backward compatibility
+from .weight_sparsity import mode, module, plugins
+from .weight_sparsity.sparsification import *
@@ -0,0 +1,23 @@
+# SPDX-FileCopyrightText: Copyright (c) 2024 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: Apache-2.0
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+"""API for weight sparsification algorithms."""
+
+from . import mode, module, plugins
+
+# Explicitly expose commonly used items
+from .mode import SparsityModeRegistry
+from .module import SparseModule, SpDMRegistry
+from .sparsification import *