stanfordnlp
diff --git a/‎docs/docs/tutorials/classification_finetuning/index.ipynb‎
Lines changed: 1 addition & 1 deletion b/‎docs/docs/tutorials/classification_finetuning/index.ipynb‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎dspy/adapters/json_adapter.py‎
Lines changed: 2 additions & 2 deletions b/‎dspy/adapters/json_adapter.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎dspy/clients/lm.py‎
Lines changed: 12 additions & 5 deletions b/‎dspy/clients/lm.py‎
Lines changed: 12 additions & 5 deletions
@@ -211,7 +211,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
 
@@ -62,8 +62,8 @@ def __call__(
             structured_output_model = _get_structured_outputs_response_format(signature)
             lm_kwargs["response_format"] = structured_output_model
             return super().__call__(lm, lm_kwargs, signature, demos, inputs)
-        except Exception as e:
-            logger.warning(f"Failed to use structured output format. Falling back to JSON mode. Error: {e}")
+        except Exception:
+            logger.warning("Failed to use structured output format, falling back to JSON mode.")
             try:
                 lm_kwargs["response_format"] = {"type": "json_object"}
                 return super().__call__(lm, lm_kwargs, signature, demos, inputs)
 
@@ -11,7 +11,7 @@
 import dspy
 from dspy.clients.cache import request_cache
 from dspy.clients.openai import OpenAIProvider
-from dspy.clients.provider import Provider, TrainingJob
+from dspy.clients.provider import Provider, TrainingJob, ReinforceJob
 from dspy.clients.utils_finetune import TrainDataFormat
 from dspy.dsp.utils.settings import settings
 from dspy.utils.callback import BaseCallback
@@ -188,10 +188,6 @@ def finetune(
     ) -> TrainingJob:
         from dspy import settings as settings
 
-        err = "Fine-tuning is an experimental feature."
-        err += " Set `dspy.settings.experimental` to `True` to use it."
-        assert settings.experimental, err
-
         err = f"Provider {self.provider} does not support fine-tuning."
         assert self.provider.finetunable, err
 
@@ -212,6 +208,17 @@ def thread_function_wrapper():
 
         return job
 
+    def reinforce(self, train_kwargs) -> ReinforceJob:
+        # TODO(GRPO Team): Should we return an initialized job here?
+        from dspy import settings as settings
+    
+        err = f"Provider {self.provider} does not implement the reinforcement learning interface."
+        assert self.provider.reinforceable, err
+
+        job = self.provider.ReinforceJob(lm=self, train_kwargs=train_kwargs)
+        job.initialize()
+        return job
+
     def _run_finetune_job(self, job: TrainingJob):
         # TODO(enhance): We should listen for keyboard interrupts somewhere.
         # Requires TrainingJob.cancel() to be implemented for each provider.
Original file line number	Diff line number	Diff line change
`@@ -211,7 +211,7 @@`
`211`	`211`	`},`
`212`	`212`	`{`
`213`	`213`	`"cell_type": "code",`
`214`		`- "execution_count": 5,`
	`214`	`+ "execution_count": null,`
`215`	`215`	`"metadata": {},`
`216`	`216`	`"outputs": [],`
`217`	`217`	`"source": [`