huggingface
diff --git a/‎README.md‎
Lines changed: 170 additions & 68 deletions b/‎README.md‎
Lines changed: 170 additions & 68 deletions
diff --git a/‎clean_checkpoint.py‎
Lines changed: 19 additions & 7 deletions b/‎clean_checkpoint.py‎
Lines changed: 19 additions & 7 deletions
diff --git a/‎requirements.txt‎
Lines changed: 2 additions & 2 deletions b/‎requirements.txt‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎results/results-all.csv‎
Lines changed: 153 additions & 95 deletions b/‎results/results-all.csv‎
Lines changed: 153 additions & 95 deletions
diff --git a/‎results/results-inv2-matched-frequency.csv‎
Lines changed: 152 additions & 94 deletions b/‎results/results-inv2-matched-frequency.csv‎
Lines changed: 152 additions & 94 deletions
diff --git a/‎sotabench.py‎
Lines changed: 127 additions & 11 deletions b/‎sotabench.py‎
Lines changed: 127 additions & 11 deletions
diff --git a/‎timm/data/__init__.py‎
Lines changed: 2 additions & 0 deletions b/‎timm/data/__init__.py‎
Lines changed: 2 additions & 0 deletions
@@ -2,17 +2,21 @@
 import argparse
 import os
 import hashlib
+import shutil
 from collections import OrderedDict
 
 parser = argparse.ArgumentParser(description='PyTorch ImageNet Validation')
 parser.add_argument('--checkpoint', default='', type=str, metavar='PATH',
                     help='path to latest checkpoint (default: none)')
-parser.add_argument('--output', default='./cleaned.pth', type=str, metavar='PATH',
+parser.add_argument('--output', default='', type=str, metavar='PATH',
                     help='output path')
 parser.add_argument('--use-ema', dest='use_ema', action='store_true',
                     help='use ema version of weights if present')
 
 
+_TEMP_NAME = './_checkpoint.pth'
+
+
 def main():
     args = parser.parse_args()
 
@@ -31,19 +35,27 @@ def main():
             if state_dict_key in checkpoint:
                 state_dict = checkpoint[state_dict_key]
             else:
-                print("Error: No state_dict found in checkpoint {}.".format(args.checkpoint))
-                exit(1)
+                state_dict = checkpoint
         else:
-            state_dict = checkpoint
+            assert False
         for k, v in state_dict.items():
             name = k[7:] if k.startswith('module') else k
             new_state_dict[name] = v
         print("=> Loaded state_dict from '{}'".format(args.checkpoint))
 
-        torch.save(new_state_dict, args.output)
-        with open(args.output, 'rb') as f:
+        torch.save(new_state_dict, _TEMP_NAME)
+        with open(_TEMP_NAME, 'rb') as f:
             sha_hash = hashlib.sha256(f.read()).hexdigest()
-        print("=> Saved state_dict to '{}, SHA256: {}'".format(args.output, sha_hash))
+
+        if args.output:
+            checkpoint_root, checkpoint_base = os.path.split(args.output)
+            checkpoint_base = os.path.splitext(checkpoint_base)[0]
+        else:
+            checkpoint_root = ''
+            checkpoint_base = os.path.splitext(args.checkpoint)[0]
+        final_filename = '-'.join([checkpoint_base, sha_hash[:8]]) + '.pth'
+        shutil.move(_TEMP_NAME, os.path.join(checkpoint_root, final_filename))
+        print("=> Saved state_dict to '{}, SHA256: {}'".format(final_filename, sha_hash))
     else:
         print("Error: Checkpoint ({}) doesn't exist".format(args.checkpoint))
 
 
@@ -1,3 +1,3 @@
-torch>=1.1.0
-torchvision>=0.3.0
+torch>=1.2.0
+torchvision>=0.4.0
 pyyaml
@@ -78,7 +78,7 @@ def _entry(model_name, paper_model_name, paper_arxiv_id, batch_size=BATCH_SIZE,
     _entry('mixnet_m', 'MixNet-M', '1907.09595'),
     _entry('mixnet_s', 'MixNet-S', '1907.09595'),
     _entry('mnasnet_100', 'MnasNet-B1', '1807.11626'),
-    _entry('mobilenetv3_100', 'MobileNet V3-Large 1.0', '1905.02244',
+    _entry('mobilenetv3_rw', 'MobileNet V3-Large 1.0', '1905.02244',
            model_desc='Trained in PyTorch with RMSProp, exponential LR decay, and hyper-params matching '
                       'paper as closely as possible.'),
     _entry('resnet18', 'ResNet-18', '1812.01187'),
@@ -108,11 +108,35 @@ def _entry(model_name, paper_model_name, paper_arxiv_id, batch_size=BATCH_SIZE,
            model_desc='Ported from official Google AI Tensorflow weights'),
     _entry('tf_efficientnet_b4', 'EfficientNet-B4 (AutoAugment)', '1905.11946', batch_size=BATCH_SIZE//2,
            model_desc='Ported from official Google AI Tensorflow weights'),
-    _entry('tf_efficientnet_b5', 'EfficientNet-B5 (AutoAugment)', '1905.11946', batch_size=BATCH_SIZE//4,
+    _entry('tf_efficientnet_b5', 'EfficientNet-B5 (RandAugment)', '1905.11946', batch_size=BATCH_SIZE//4,
            model_desc='Ported from official Google AI Tensorflow weights'),
     _entry('tf_efficientnet_b6', 'EfficientNet-B6 (AutoAugment)', '1905.11946', batch_size=BATCH_SIZE//8,
            model_desc='Ported from official Google AI Tensorflow weights'),
-    _entry('tf_efficientnet_b7', 'EfficientNet-B7 (AutoAugment)', '1905.11946', batch_size=BATCH_SIZE//8,
+    _entry('tf_efficientnet_b7', 'EfficientNet-B7 (RandAugment)', '1905.11946', batch_size=BATCH_SIZE//8,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b0_ap', 'EfficientNet-B0 (AdvProp)', '1911.09665',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b1_ap', 'EfficientNet-B1 (AdvProp)', '1911.09665',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b2_ap', 'EfficientNet-B2 (AdvProp)', '1911.09665',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b3_ap', 'EfficientNet-B3 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 2,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b4_ap', 'EfficientNet-B4 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 2,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b5_ap', 'EfficientNet-B5 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 4,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b6_ap', 'EfficientNet-B6 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 8,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b7_ap', 'EfficientNet-B7 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 8,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_b8_ap', 'EfficientNet-B8 (AdvProp)', '1911.09665', batch_size=BATCH_SIZE // 8,
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_cc_b0_4e', 'EfficientNet-CondConv-B0 4 experts', '1904.04971',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_cc_b0_8e', 'EfficientNet-CondConv-B0 8 experts', '1904.04971',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_efficientnet_cc_b1_8e', 'EfficientNet-CondConv-B1 8 experts', '1904.04971',
            model_desc='Ported from official Google AI Tensorflow weights'),
     _entry('tf_efficientnet_es', 'EfficientNet-EdgeTPU-S', '1905.11946',
            model_desc='Ported from official Google AI Tensorflow weights'),
@@ -124,6 +148,18 @@ def _entry(model_name, paper_model_name, paper_arxiv_id, batch_size=BATCH_SIZE,
     _entry('tf_mixnet_l', 'MixNet-L', '1907.09595', model_desc='Ported from official Google AI Tensorflow weights'),
     _entry('tf_mixnet_m', 'MixNet-M', '1907.09595', model_desc='Ported from official Google AI Tensorflow weights'),
     _entry('tf_mixnet_s', 'MixNet-S', '1907.09595', model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_large_100', 'MobileNet V3-Large 1.0', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_large_075', 'MobileNet V3-Large 0.75', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_large_minimal_100', 'MobileNet V3-Large Minimal 1.0', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_small_100', 'MobileNet V3-Small 1.0', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_small_075', 'MobileNet V3-Small 0.75', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
+    _entry('tf_mobilenetv3_small_minimal_100', 'MobileNet V3-Small Minimal 1.0', '1905.02244',
+           model_desc='Ported from official Google AI Tensorflow weights'),
 
     ## Cadene ported weights (to remove if Cadene adds sotabench)
     _entry('inception_resnet_v2', 'Inception ResNet V2', '1602.07261'),
@@ -154,18 +190,87 @@ def _entry(model_name, paper_model_name, paper_arxiv_id, batch_size=BATCH_SIZE,
     # _entry('wide_resnet101_2', , ),
 
     ## Facebook WSL weights
-    _entry('ig_resnext101_32x8d', 'ResNeXt-101 32x8d', '1805.00932'),
-    _entry('ig_resnext101_32x16d', 'ResNeXt-101 32x16d', '1805.00932'),
-    _entry('ig_resnext101_32x32d', 'ResNeXt-101 32x32d', '1805.00932', batch_size=BATCH_SIZE // 2),
-    _entry('ig_resnext101_32x48d', 'ResNeXt-101 32x48d', '1805.00932', batch_size=BATCH_SIZE // 4),
+    _entry('ig_resnext101_32x8d', 'ResNeXt-101 32x8d', '1805.00932',
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
+    _entry('ig_resnext101_32x16d', 'ResNeXt-101 32x16d', '1805.00932',
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
+    _entry('ig_resnext101_32x32d', 'ResNeXt-101 32x32d', '1805.00932', batch_size=BATCH_SIZE // 2,
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
+    _entry('ig_resnext101_32x48d', 'ResNeXt-101 32x48d', '1805.00932', batch_size=BATCH_SIZE // 4,
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
+
     _entry('ig_resnext101_32x8d', 'ResNeXt-101 32x8d (288x288 Mean-Max Pooling)', '1805.00932',
-           ttp=True, args=dict(img_size=288)),
+           ttp=True, args=dict(img_size=288),
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
     _entry('ig_resnext101_32x16d', 'ResNeXt-101 32x16d (288x288 Mean-Max Pooling)', '1805.00932',
-           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 2),
+           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 2,
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
     _entry('ig_resnext101_32x32d', 'ResNeXt-101 32x32d (288x288 Mean-Max Pooling)', '1805.00932',
-           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 4),
+           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 4,
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
     _entry('ig_resnext101_32x48d', 'ResNeXt-101 32x48d (288x288 Mean-Max Pooling)', '1805.00932',
-           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 8),
+           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 8,
+           model_desc='Weakly-Supervised pre-training on 1B Instagram hashtag dataset by Facebook Research'),
+
+    ## Facebook SSL weights
+    _entry('ssl_resnet18', 'ResNet-18', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnet50', 'ResNet-50', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext50_32x4d', 'ResNeXt-50 32x4d', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x4d', 'ResNeXt-101 32x4d', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x8d', 'ResNeXt-101 32x8d', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x16d', 'ResNeXt-101 32x16d', '1905.00546',
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+
+    _entry('ssl_resnet50', 'ResNet-50 (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext50_32x4d', 'ResNeXt-50 32x4d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x4d', 'ResNeXt-101 32x4d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x8d', 'ResNeXt-101 32x8d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+    _entry('ssl_resnext101_32x16d', 'ResNeXt-101 32x16d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 2,
+           model_desc='Semi-Supervised pre-training on YFCC100M dataset by Facebook Research'),
+
+    ## Facebook SWSL weights
+    _entry('swsl_resnet18', 'ResNet-18', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnet50', 'ResNet-50', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext50_32x4d', 'ResNeXt-50 32x4d', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x4d', 'ResNeXt-101 32x4d', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x8d', 'ResNeXt-101 32x8d', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x16d', 'ResNeXt-101 32x16d', '1905.00546',
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+
+    _entry('swsl_resnet50', 'ResNet-50 (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext50_32x4d', 'ResNeXt-50 32x4d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x4d', 'ResNeXt-101 32x4d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x8d', 'ResNeXt-101 32x8d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288),
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
+    _entry('swsl_resnext101_32x16d', 'ResNeXt-101 32x16d (288x288 Mean-Max Pooling)', '1905.00546',
+           ttp=True, args=dict(img_size=288), batch_size=BATCH_SIZE // 2,
+           model_desc='Semi-Weakly-Supervised pre-training on 1 billion unlabelled dataset by Facebook Research'),
 
     ## DLA official impl weights (to remove if sotabench added to source)
     _entry('dla34', 'DLA-34', '1707.06484'),
@@ -189,6 +294,17 @@ def _entry(model_name, paper_model_name, paper_arxiv_id, batch_size=BATCH_SIZE,
     _entry('res2next50', 'Res2NeXt-50', '1904.01169'),
     _entry('dla60_res2net', 'Res2Net-DLA-60', '1904.01169'),
     _entry('dla60_res2next', 'Res2NeXt-DLA-60', '1904.01169'),
+
+    ## HRNet official impl weights
+    _entry('hrnet_w18_small', 'HRNet-W18-C-Small-V1', '1908.07919'),
+    _entry('hrnet_w18_small_v2', 'HRNet-W18-C-Small-V2', '1908.07919'),
+    _entry('hrnet_w18', 'HRNet-W18-C', '1908.07919'),
+    _entry('hrnet_w30', 'HRNet-W30-C', '1908.07919'),
+    _entry('hrnet_w32', 'HRNet-W32-C', '1908.07919'),
+    _entry('hrnet_w40', 'HRNet-W40-C', '1908.07919'),
+    _entry('hrnet_w44', 'HRNet-W44-C', '1908.07919'),
+    _entry('hrnet_w48', 'HRNet-W48-C', '1908.07919'),
+    _entry('hrnet_w64', 'HRNet-W64-C', '1908.07919'),
 ]
 
 for m in model_list:
 
@@ -4,3 +4,5 @@
 from .transforms import *
 from .loader import create_loader, create_transform
 from .mixup import mixup_target, FastCollateMixup
+from .auto_augment import RandAugment, AutoAugment, rand_augment_ops, auto_augment_policy,\
+    rand_augment_transform, auto_augment_transform