From c4eabcb3b0a13af8d2a6b812e9c7d30504291e91 Mon Sep 17 00:00:00 2001
From: DellaBitta <drsanta@google.com>
Date: Mon, 1 Dec 2025 14:29:13 -0500
Subject: [PATCH 1/3] Fix some flaky generation tests

---
 packages/ai/integration/chat.test.ts          | 45 ++++---------------
 .../ai/integration/generate-content.test.ts   | 37 ++++++---------
 2 files changed, 21 insertions(+), 61 deletions(-)

diff --git a/packages/ai/integration/chat.test.ts b/packages/ai/integration/chat.test.ts
index b6772a38fb1..ff4966a71c4 100644
--- a/packages/ai/integration/chat.test.ts
+++ b/packages/ai/integration/chat.test.ts
@@ -102,31 +102,14 @@ describe('Chat Session', () => {
             17, // "What is the capital of France?" + system instruction
             TOKEN_COUNT_DELTA + 2 // More variance for chat context
           );
-          expect(response1.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            8, // "Paris"
-            TOKEN_COUNT_DELTA
-          );
-          expect(response1.usageMetadata!.totalTokenCount).to.be.closeTo(
-            49, // "What is the capital of France?" + system instruction + "Paris"
-            TOKEN_COUNT_DELTA + 3 // More variance for chat context
-          );
-          expect(response1.usageMetadata!.totalTokenCount).to.be.closeTo(
-            49, // "What is the capital of France?" + system instruction + "Paris"
-            TOKEN_COUNT_DELTA + 3 // More variance for chat context
-          );
-
+          expect(response1.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response1.usageMetadata!.totalTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.promptTokenCount).to.be.closeTo(
             32, // History + "And what about Italy?" + system instruction
             TOKEN_COUNT_DELTA + 5 // More variance for chat context with history
           );
-          expect(response2.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            8,
-            TOKEN_COUNT_DELTA
-          );
-          expect(response2.usageMetadata!.totalTokenCount).to.be.closeTo(
-            68,
-            TOKEN_COUNT_DELTA + 2
-          );
+          expect(response2.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response2.usageMetadata!.totalTokenCount).to.not.equal(0);
         } else if (model.model.includes('gemini-2.0-flash')) {
           expect(response1.usageMetadata).to.not.be.null;
           // Token counts can vary slightly in chat context
@@ -134,26 +117,14 @@ describe('Chat Session', () => {
             15, // "What is the capital of France?" + system instruction
             TOKEN_COUNT_DELTA + 2 // More variance for chat context
           );
-          expect(response1.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            8, // "Paris"
-            TOKEN_COUNT_DELTA
-          );
-          expect(response1.usageMetadata!.totalTokenCount).to.be.closeTo(
-            23, // "What is the capital of France?" + system instruction + "Paris"
-            TOKEN_COUNT_DELTA + 3 // More variance for chat context
-          );
+          expect(response1.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response1.usageMetadata!.totalTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.promptTokenCount).to.be.closeTo(
             28, // History + "And what about Italy?" + system instruction
             TOKEN_COUNT_DELTA + 5 // More variance for chat context with history
           );
-          expect(response2.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            8,
-            TOKEN_COUNT_DELTA
-          );
-          expect(response2.usageMetadata!.totalTokenCount).to.be.closeTo(
-            36,
-            TOKEN_COUNT_DELTA
-          );
+          expect(response2.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response2.usageMetadata!.totalTokenCount).to.not.equal(0);
         }
       });
     });
diff --git a/packages/ai/integration/generate-content.test.ts b/packages/ai/integration/generate-content.test.ts
index ffb1ecca698..ee521b8d5c6 100644
--- a/packages/ai/integration/generate-content.test.ts
+++ b/packages/ai/integration/generate-content.test.ts
@@ -92,18 +92,9 @@ describe('Generate Content', function () {
             22,
             TOKEN_COUNT_DELTA
           );
-          expect(response.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            2,
-            TOKEN_COUNT_DELTA
-          );
-          expect(response.usageMetadata!.thoughtsTokenCount).to.be.closeTo(
-            30,
-            TOKEN_COUNT_DELTA * 2
-          );
-          expect(response.usageMetadata!.totalTokenCount).to.be.closeTo(
-            55,
-            TOKEN_COUNT_DELTA * 2
-          );
+          expect(response.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response.usageMetadata!.thoughtsTokenCount).to.not.equal(0);
+          expect(response.usageMetadata!.totalTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.promptTokensDetails).to.not.be.null;
           expect(response.usageMetadata!.promptTokensDetails!.length).to.equal(
             1
@@ -121,14 +112,8 @@ describe('Generate Content', function () {
             21,
             TOKEN_COUNT_DELTA
           );
-          expect(response.usageMetadata!.candidatesTokenCount).to.be.closeTo(
-            4,
-            TOKEN_COUNT_DELTA
-          );
-          expect(response.usageMetadata!.totalTokenCount).to.be.closeTo(
-            25,
-            TOKEN_COUNT_DELTA * 2
-          );
+          expect(response.usageMetadata!.candidatesTokenCount).to.not.equal(0);
+          expect(response.usageMetadata!.totalTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.promptTokensDetails).to.not.be.null;
           expect(response.usageMetadata!.promptTokensDetails!.length).to.equal(
             1
@@ -149,7 +134,7 @@ describe('Generate Content', function () {
           ).to.equal(Modality.TEXT);
           expect(
             response.usageMetadata!.candidatesTokensDetails![0].tokenCount
-          ).to.be.closeTo(4, TOKEN_COUNT_DELTA);
+          ).to.not.equal(0);
         }
       });
 
@@ -230,8 +215,12 @@ describe('Generate Content', function () {
 
           const usageMetadata = response.usageMetadata;
           expect(usageMetadata).to.exist;
-          expect(usageMetadata?.toolUsePromptTokenCount).to.exist;
-          expect(usageMetadata?.toolUsePromptTokenCount).to.be.greaterThan(0);
+          // usageMetaData.toolUsePromptTokenCount does not exist in Gemini 2.0 flash responses.
+          if (!model.model.includes('gemini-2.0-flash')) {
+            
+            expect(usageMetadata?.toolUsePromptTokenCount).to.exist;
+            expect(usageMetadata?.toolUsePromptTokenCount).to.be.greaterThan(0);
+          }
         });
 
         it('generateContent: url context and google search grounding', async () => {
@@ -288,7 +277,7 @@ describe('Generate Content', function () {
           });
 
           const result = await model.generateContent(
-            'Recommend 3 books for beginners to read to learn more about the latest advancements in Quantum Computing.'
+            'Recommend 3 books for beginners to read to learn more about the latest advancements in Quantum Computing'
           );
           const response = result.response;
           const urlContextMetadata =

From 90f7c09e82dcc6d4003a995bdabde8ebf41bd803 Mon Sep 17 00:00:00 2001
From: DellaBitta <drsanta@google.com>
Date: Mon, 1 Dec 2025 14:42:01 -0500
Subject: [PATCH 2/3] format fix.

---
 packages/ai/integration/generate-content.test.ts | 1 -
 1 file changed, 1 deletion(-)

diff --git a/packages/ai/integration/generate-content.test.ts b/packages/ai/integration/generate-content.test.ts
index ee521b8d5c6..3ae585efca0 100644
--- a/packages/ai/integration/generate-content.test.ts
+++ b/packages/ai/integration/generate-content.test.ts
@@ -217,7 +217,6 @@ describe('Generate Content', function () {
           expect(usageMetadata).to.exist;
           // usageMetaData.toolUsePromptTokenCount does not exist in Gemini 2.0 flash responses.
           if (!model.model.includes('gemini-2.0-flash')) {
-            
             expect(usageMetadata?.toolUsePromptTokenCount).to.exist;
             expect(usageMetadata?.toolUsePromptTokenCount).to.be.greaterThan(0);
           }

From 686c3e2b148a9b5f072002853a69221ad1552296 Mon Sep 17 00:00:00 2001
From: DellaBitta <drsanta@google.com>
Date: Mon, 1 Dec 2025 14:48:50 -0500
Subject: [PATCH 3/3] Remove all closeTo tests

---
 packages/ai/integration/chat.test.ts          | 22 +++++--------------
 .../ai/integration/generate-content.test.ts   | 14 ++++--------
 2 files changed, 9 insertions(+), 27 deletions(-)

diff --git a/packages/ai/integration/chat.test.ts b/packages/ai/integration/chat.test.ts
index ff4966a71c4..4d76652920e 100644
--- a/packages/ai/integration/chat.test.ts
+++ b/packages/ai/integration/chat.test.ts
@@ -24,7 +24,7 @@ import {
   SafetySetting,
   getGenerativeModel
 } from '../src';
-import { testConfigs, TOKEN_COUNT_DELTA } from './constants';
+import { testConfigs } from './constants';
 
 describe('Chat Session', () => {
   testConfigs.forEach(testConfig => {
@@ -98,31 +98,19 @@ describe('Chat Session', () => {
 
         if (model.model.includes('gemini-2.5-flash')) {
           // Token counts can vary slightly in chat context
-          expect(response1.usageMetadata!.promptTokenCount).to.be.closeTo(
-            17, // "What is the capital of France?" + system instruction
-            TOKEN_COUNT_DELTA + 2 // More variance for chat context
-          );
+          expect(response1.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response1.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response1.usageMetadata!.totalTokenCount).to.not.equal(0);
-          expect(response2.usageMetadata!.promptTokenCount).to.be.closeTo(
-            32, // History + "And what about Italy?" + system instruction
-            TOKEN_COUNT_DELTA + 5 // More variance for chat context with history
-          );
+          expect(response2.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.totalTokenCount).to.not.equal(0);
         } else if (model.model.includes('gemini-2.0-flash')) {
           expect(response1.usageMetadata).to.not.be.null;
           // Token counts can vary slightly in chat context
-          expect(response1.usageMetadata!.promptTokenCount).to.be.closeTo(
-            15, // "What is the capital of France?" + system instruction
-            TOKEN_COUNT_DELTA + 2 // More variance for chat context
-          );
+          expect(response1.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response1.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response1.usageMetadata!.totalTokenCount).to.not.equal(0);
-          expect(response2.usageMetadata!.promptTokenCount).to.be.closeTo(
-            28, // History + "And what about Italy?" + system instruction
-            TOKEN_COUNT_DELTA + 5 // More variance for chat context with history
-          );
+          expect(response2.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response2.usageMetadata!.totalTokenCount).to.not.equal(0);
         }
diff --git a/packages/ai/integration/generate-content.test.ts b/packages/ai/integration/generate-content.test.ts
index 3ae585efca0..e56203c1f9f 100644
--- a/packages/ai/integration/generate-content.test.ts
+++ b/packages/ai/integration/generate-content.test.ts
@@ -29,7 +29,7 @@ import {
   URLRetrievalStatus,
   getGenerativeModel
 } from '../src';
-import { testConfigs, TOKEN_COUNT_DELTA } from './constants';
+import { testConfigs } from './constants';
 
 describe('Generate Content', function () {
   this.timeout(20_000);
@@ -88,10 +88,7 @@ describe('Generate Content', function () {
         expect(response.usageMetadata).to.not.be.null;
 
         if (model.model.includes('gemini-2.5-flash')) {
-          expect(response.usageMetadata!.promptTokenCount).to.be.closeTo(
-            22,
-            TOKEN_COUNT_DELTA
-          );
+          expect(response.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.thoughtsTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.totalTokenCount).to.not.equal(0);
@@ -104,14 +101,11 @@ describe('Generate Content', function () {
           ).to.equal(Modality.TEXT);
           expect(
             response.usageMetadata!.promptTokensDetails![0].tokenCount
-          ).to.closeTo(22, TOKEN_COUNT_DELTA);
+          ).to.not.equal(0);
 
           // candidatesTokenDetails comes back about half the time, so let's just not test it.
         } else if (model.model.includes('gemini-2.0-flash')) {
-          expect(response.usageMetadata!.promptTokenCount).to.be.closeTo(
-            21,
-            TOKEN_COUNT_DELTA
-          );
+          expect(response.usageMetadata!.promptTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.candidatesTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.totalTokenCount).to.not.equal(0);
           expect(response.usageMetadata!.promptTokensDetails).to.not.be.null;