Judge layer for tool calling models

KillianLucas · KillianLucas · commit 7925e4eac0ac · 2024-07-24T23:51:13.000-07:00
diff --git a/interpreter/core/llm/run_function_calling_llm.py b/interpreter/core/llm/run_function_calling_llm.py
@@ -57,18 +57,30 @@ def run_function_calling_llm(llm, request_params):
         if "content" in delta and delta["content"]:
             if function_call_detected:
                 # More content after a code block? This is a code review by a judge layer.
+
                 # print("Code safety review:", delta["content"])
-                accumulated_review += delta["content"]
 
                 if review_category == None:
-                    if "<UNSAFE>" in accumulated_review:
+                    accumulated_review += delta["content"]
+
+                    if "<unsafe>" in accumulated_review:
                         review_category = "unsafe"
-                    if "<WARNING>" in accumulated_review:
+                    if "<warning>" in accumulated_review:
                         review_category = "warning"
-                    if "<SAFE>" in accumulated_review:
+                    if "<safe>" in accumulated_review:
                         review_category = "safe"
 
                 if review_category != None:
+                    for tag in [
+                        "<safe>",
+                        "</safe>",
+                        "<warning>",
+                        "</warning>",
+                        "<unsafe>",
+                        "</unsafe>",
+                    ]:
+                        delta["content"] = delta["content"].replace(tag, "")
+
                     yield {
                         "type": "review",
                         "format": review_category,
diff --git a/interpreter/core/llm/run_tool_calling_llm.py b/interpreter/core/llm/run_tool_calling_llm.py
@@ -63,6 +63,7 @@ def run_tool_calling_llm(llm, request_params):
     accumulated_deltas = {}
     language = None
     code = ""
+    function_call_detected = False
 
     for chunk in llm.completions(**request_params):
         if "choices" not in chunk or len(chunk["choices"]) == 0:
@@ -73,6 +74,8 @@ def run_tool_calling_llm(llm, request_params):
 
         # Convert tool call into function call, which we have great parsing logic for below
         if "tool_calls" in delta and delta["tool_calls"]:
+            function_call_detected = True
+
             # import pdb; pdb.set_trace()
             if len(delta["tool_calls"]) > 0 and delta["tool_calls"][0].function:
                 delta = {
@@ -87,7 +90,40 @@ def run_tool_calling_llm(llm, request_params):
         accumulated_deltas = merge_deltas(accumulated_deltas, delta)
 
         if "content" in delta and delta["content"]:
-            yield {"type": "message", "content": delta["content"]}
+            if function_call_detected:
+                # More content after a code block? This is a code review by a judge layer.
+
+                # print("Code safety review:", delta["content"])
+
+                if review_category == None:
+                    accumulated_review += delta["content"]
+
+                    if "<unsafe>" in accumulated_review:
+                        review_category = "unsafe"
+                    if "<warning>" in accumulated_review:
+                        review_category = "warning"
+                    if "<safe>" in accumulated_review:
+                        review_category = "safe"
+
+                if review_category != None:
+                    for tag in [
+                        "<safe>",
+                        "</safe>",
+                        "<warning>",
+                        "</warning>",
+                        "<unsafe>",
+                        "</unsafe>",
+                    ]:
+                        delta["content"] = delta["content"].replace(tag, "")
+
+                    yield {
+                        "type": "review",
+                        "format": review_category,
+                        "content": delta["content"],
+                    }
+
+            else:
+                yield {"type": "message", "content": delta["content"]}
 
         if (
             accumulated_deltas.get("function_call")