listing cleanup

ourmony · ourmony · commit 7137cce5b5fc · 2025-01-06T08:29:00.000-05:00
diff --git a/tools/listing.py b/tools/listing.py
@@ -227,4 +227,4 @@ def generate_readme() -> None:
 
 
 if __name__ == "__main__":
-    generate_readme()
+    generate_readme()
diff --git a/tools/listing.yaml b/tools/listing.yaml
@@ -66,6 +66,19 @@
   tasks: ["cybench"]
   tags: ["Agent"]
 
+- title: "CyberSecEval_2: A Wide-Ranging Cybersecurity Evaluation Suite for Large Language Models"
+  description: |
+    Evaluates Large Language Models for risky capabilities in cybersecurity.
+  path: src/inspect_evals/cyberseceval_2
+  arxiv: https://arxiv.org/pdf/2404.13161
+  group: Cybersecurity
+  contributors: ["its-emile"]
+  tasks: [
+    "interpreter_abuse",
+    "prompt_injection",
+    "vulnerability_exploit"
+  ]
+
 - title: "InterCode: Capture the Flag"
   description: |
     Measure expertise in coding, cryptography (i.e. binary exploitation, forensics), reverse engineering, and recognizing security vulnerabilities. Demonstrates tool use and sandboxing untrusted model code.
@@ -352,17 +365,4 @@
       "agie_sat_en",
       "agie_sat_en_without_passage",
       "agie_sat_math",
-    ]
-
-- title: "CyberSecEval_2: A Wide-Ranging Cybersecurity Evaluation Suite for Large Language Models"
-  description: |
-    Evaluates Large Language Models for risky capabilities in cybersecurity.
-  path: src/inspect_evals/cyberseceval_2
-  arxiv: https://arxiv.org/pdf/2404.13161
-  group: Cybersecurity
-  contributors: ["its-emile"]
-  tasks: [
-    "interpreter_abuse",
-    "prompt_injection",
-    "vulnerability_exploit"
-  ]
+    ]

Original file line number	Diff line number	Diff line change
`@@ -227,4 +227,4 @@ def generate_readme() -> None:`
`227`	`227`
`228`	`228`
`229`	`229`	`if __name__ == "__main__":`
`230`		`- generate_readme()`
	`230`	`+ generate_readme()`