foldaway
diff --git a/‎packages/triage/README.md‎
Lines changed: 3 additions & 3 deletions b/‎packages/triage/README.md‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎packages/triage/src/helpers/estimateOpenAICost.test.ts‎
Lines changed: 99 additions & 0 deletions b/‎packages/triage/src/helpers/estimateOpenAICost.test.ts‎
Lines changed: 99 additions & 0 deletions
diff --git a/‎packages/triage/src/helpers/estimateOpenAICost.ts‎
Lines changed: 101 additions & 8 deletions b/‎packages/triage/src/helpers/estimateOpenAICost.ts‎
Lines changed: 101 additions & 8 deletions
diff --git a/‎packages/triage/src/llm/client.test.ts‎
Lines changed: 56 additions & 0 deletions b/‎packages/triage/src/llm/client.test.ts‎
Lines changed: 56 additions & 0 deletions
diff --git a/‎packages/triage/src/llm/client.ts‎
Lines changed: 79 additions & 0 deletions b/‎packages/triage/src/llm/client.ts‎
Lines changed: 79 additions & 0 deletions
@@ -42,9 +42,9 @@ Required environment variables:
 
 Model dependency:
 
-- `extractClaimsFromNewEvidence` uses `gpt-5-mini`.
-- `triageNewEvidence` uses `gpt-5-mini`.
-- title/slug generation uses `gpt-5-nano`.
+- `extractClaimsFromNewEvidence` uses `gpt-5.4-mini`.
+- `triageNewEvidence` uses `gpt-5.4-mini`.
+- title/slug generation uses `gpt-5.4-nano`.
 - translation uses `gpt-5.4-nano`.
 
 Expected cost before running the checked-in eval set: less than USD 1 with the
 
@@ -0,0 +1,99 @@
+import { describe, expect, it } from 'vitest';
+import {
+  estimateOpenAICostFromUsage,
+  OpenAIUsageCostTracker,
+} from './estimateOpenAICost.js';
+
+describe('estimateOpenAICostFromUsage', () => {
+  it('prices gpt-5.4 mini usage with cached input tokens', () => {
+    const estimate = estimateOpenAICostFromUsage({
+      model: 'gpt-5.4-mini',
+      usage: {
+        inputTokens: 1000,
+        cachedInputTokens: 100,
+        outputTokens: 2000,
+        totalTokens: 3000,
+      },
+    });
+
+    expect(estimate?.estimatedCostUsd).toBeCloseTo(0.0096825);
+  });
+
+  it('prices gpt-5.4 nano usage', () => {
+    const estimate = estimateOpenAICostFromUsage({
+      model: 'gpt-5.4-nano',
+      usage: {
+        inputTokens: 1000,
+        cachedInputTokens: 100,
+        outputTokens: 2000,
+        totalTokens: 3000,
+      },
+    });
+
+    expect(estimate?.estimatedCostUsd).toBeCloseTo(0.002682);
+  });
+});
+
+describe('OpenAIUsageCostTracker', () => {
+  it('sums usage and cost across multiple responses', () => {
+    const tracker = new OpenAIUsageCostTracker();
+
+    tracker.add({
+      model: 'gpt-5.4-mini',
+      usage: {
+        inputTokens: 1000,
+        cachedInputTokens: 100,
+        outputTokens: 2000,
+        totalTokens: 3000,
+      },
+    });
+    tracker.add({
+      model: 'gpt-5.4-mini',
+      usage: {
+        inputTokens: 3000,
+        cachedInputTokens: 200,
+        outputTokens: 4000,
+        totalTokens: 7000,
+      },
+    });
+
+    const summary = tracker.summary();
+
+    expect(summary.estimatedCostUsd).toBeCloseTo(0.0291975);
+    expect(summary).toEqual({
+      usage: {
+        inputTokens: 4000,
+        cachedInputTokens: 300,
+        outputTokens: 6000,
+        totalTokens: 10000,
+      },
+      estimatedCostUsd: summary.estimatedCostUsd,
+      modelsWithoutPricing: [],
+    });
+  });
+
+  it('tracks models without configured pricing', () => {
+    const tracker = new OpenAIUsageCostTracker();
+
+    tracker.add({
+      model: 'unknown-model',
+      usage: {
+        inputTokens: 1000,
+        cachedInputTokens: 0,
+        outputTokens: 1000,
+        totalTokens: 2000,
+      },
+    });
+
+    expect(tracker.summary()).toEqual({
+      usage: {
+        inputTokens: 1000,
+        cachedInputTokens: 0,
+        outputTokens: 1000,
+        totalTokens: 2000,
+      },
+      estimatedCostUsd: null,
+      modelsWithoutPricing: ['unknown-model'],
+    });
+  });
+});
@@ -35,16 +35,27 @@ export type OpenAIModelPricing = {
   outputUsdPer1MTokens: number;
 };
 
+export type OpenAIUsageCostSummary = {
+  usage: OpenAITokenUsage | null;
+  estimatedCostUsd: number | null;
+  modelsWithoutPricing: string[];
+};
+
 export const OPENAI_MODEL_PRICING: Record<string, OpenAIModelPricing> = {
-  'gpt-5-mini': {
-    inputUsdPer1MTokens: 0.25,
-    cachedInputUsdPer1MTokens: 0.025,
-    outputUsdPer1MTokens: 2,
+  'gpt-5.4': {
+    inputUsdPer1MTokens: 2.5,
+    cachedInputUsdPer1MTokens: 0.25,
+    outputUsdPer1MTokens: 15,
   },
-  'gpt-5-nano': {
-    inputUsdPer1MTokens: 0.05,
-    cachedInputUsdPer1MTokens: 0.005,
-    outputUsdPer1MTokens: 0.4,
+  'gpt-5.4-mini': {
+    inputUsdPer1MTokens: 0.75,
+    cachedInputUsdPer1MTokens: 0.075,
+    outputUsdPer1MTokens: 4.5,
+  },
+  'gpt-5.4-nano': {
+    inputUsdPer1MTokens: 0.2,
+    cachedInputUsdPer1MTokens: 0.02,
+    outputUsdPer1MTokens: 1.25,
   },
 };
 
@@ -114,3 +125,85 @@ export function estimateOpenAICostFromUsage({
     pricing,
   };
 }
+
+export function sumOpenAITokenUsage(
+  left: OpenAITokenUsage | null,
+  right: OpenAITokenUsage | null,
+): OpenAITokenUsage | null {
+  if (left == null) {
+    return right;
+  }
+  if (right == null) {
+    return left;
+  }
+
+  return {
+    inputTokens: left.inputTokens + right.inputTokens,
+    cachedInputTokens: left.cachedInputTokens + right.cachedInputTokens,
+    outputTokens: left.outputTokens + right.outputTokens,
+    totalTokens: left.totalTokens + right.totalTokens,
+  };
+}
+
+export class OpenAIUsageCostTracker {
+  private usage: OpenAITokenUsage | null = null;
+  private estimatedCostUsd = 0;
+  private readonly modelsWithoutPricing = new Set<string>();
+
+  add({ model, usage }: { model: string; usage: OpenAITokenUsage | null }) {
+    if (usage == null) {
+      return;
+    }
+
+    this.usage = sumOpenAITokenUsage(this.usage, usage);
+
+    const estimate = estimateOpenAICostFromUsage({ model, usage });
+    if (estimate == null) {
+      this.modelsWithoutPricing.add(model);
+      return;
+    }
+
+    this.estimatedCostUsd += estimate.estimatedCostUsd;
+  }
+
+  summary(): OpenAIUsageCostSummary {
+    return {
+      usage: this.usage,
+      estimatedCostUsd:
+        this.modelsWithoutPricing.size === 0 ? this.estimatedCostUsd : null,
+      modelsWithoutPricing: [...this.modelsWithoutPricing].sort(),
+    };
+  }
+}
+
+export function logOpenAIUsageCostSummary({
+  label,
+  summary,
+}: {
+  label: string;
+  summary: OpenAIUsageCostSummary;
+}) {
+  if (summary.usage == null) {
+    console.log(`[${label}] Usage is unavailable`);
+    return;
+  }
+
+  console.log(`[${label}] Total usage:`, {
+    inputTokens: summary.usage.inputTokens,
+    cachedInputTokens: summary.usage.cachedInputTokens,
+    outputTokens: summary.usage.outputTokens,
+    totalTokens: summary.usage.totalTokens,
+  });
+
+  if (summary.estimatedCostUsd != null) {
+    console.log(
+      `[${label}] Total estimated cost (USD):`,
+      summary.estimatedCostUsd.toFixed(8),
+    );
+    return;
+  }
+
+  console.log(
+    `[${label}] No pricing configured for model(s): ${summary.modelsWithoutPricing.join(', ')}`,
+  );
+}
@@ -0,0 +1,56 @@
+import { describe, expect, it, vi } from 'vitest';
+import { isRetryableOpenAIError, runOpenAIRequestWithRetry } from './client.js';
+
+describe('isRetryableOpenAIError', () => {
+  it('treats transient statuses as retryable', () => {
+    expect(isRetryableOpenAIError({ status: 408 })).toBe(true);
+    expect(isRetryableOpenAIError({ status: 409 })).toBe(true);
+    expect(isRetryableOpenAIError({ status: 429 })).toBe(true);
+    expect(isRetryableOpenAIError({ status: 500 })).toBe(true);
+  });
+
+  it('does not retry client validation errors', () => {
+    expect(isRetryableOpenAIError({ status: 400 })).toBe(false);
+    expect(isRetryableOpenAIError({ status: 422 })).toBe(false);
+  });
+});
+
+describe('runOpenAIRequestWithRetry', () => {
+  it('retries a transient failure and returns the successful result', async () => {
+    const warnSpy = vi.spyOn(console, 'warn').mockImplementation(() => {});
+    const request = vi
+      .fn<() => Promise<string>>()
+      .mockRejectedValueOnce({ status: 500 })
+      .mockResolvedValueOnce('ok');
+    const sleep = vi.fn<() => Promise<void>>().mockResolvedValue(undefined);
+
+    await expect(
+      runOpenAIRequestWithRetry(request, {
+        label: 'testRequest',
+        initialDelayMs: 5,
+        sleep,
+      }),
+    ).resolves.toBe('ok');
+
+    expect(request).toHaveBeenCalledTimes(2);
+    expect(sleep).toHaveBeenCalledWith(5);
+    warnSpy.mockRestore();
+  });
+
+  it('does not retry non-retryable failures', async () => {
+    const request = vi.fn<() => Promise<string>>().mockRejectedValue({
+      status: 400,
+    });
+    const sleep = vi.fn<() => Promise<void>>().mockResolvedValue(undefined);
+
+    await expect(
+      runOpenAIRequestWithRetry(request, {
+        label: 'testRequest',
+        sleep,
+      }),
+    ).rejects.toEqual({ status: 400 });
+
+    expect(request).toHaveBeenCalledTimes(1);
+    expect(sleep).not.toHaveBeenCalled();
+  });
+});
@@ -1,5 +1,12 @@
 import OpenAI from 'openai';
 
+export type OpenAIRetryOptions = {
+  label: string;
+  maxAttempts?: number;
+  initialDelayMs?: number;
+  sleep?: (ms: number) => Promise<void>;
+};
+
 export function getOpenAiClient() {
   const apiKey = process.env.OPENAI_API_KEY;
   if (apiKey == null || apiKey.trim() === '') {
@@ -10,3 +17,75 @@ export function getOpenAiClient() {
     apiKey,
   });
 }
+
+export async function runOpenAIRequestWithRetry<T>(
+  request: () => Promise<T>,
+  {
+    label,
+    maxAttempts = 4,
+    initialDelayMs = 500,
+    sleep = sleepMs,
+  }: OpenAIRetryOptions,
+): Promise<T> {
+  let attempt = 1;
+
+  while (true) {
+    try {
+      return await request();
+    } catch (error) {
+      if (attempt >= maxAttempts || !isRetryableOpenAIError(error)) {
+        throw error;
+      }
+
+      const delayMs = initialDelayMs * 2 ** (attempt - 1);
+      console.warn(
+        `${label}: OpenAI request failed with a retryable error; retrying attempt ${attempt + 1}/${maxAttempts} in ${delayMs}ms.`,
+      );
+
+      await sleep(delayMs);
+      attempt++;
+    }
+  }
+}
+
+export function isRetryableOpenAIError(error: unknown): boolean {
+  if (error == null || typeof error !== 'object') {
+    return false;
+  }
+
+  const status = getNumericProperty(error, 'status');
+  if (status != null) {
+    return status === 408 || status === 409 || status === 429 || status >= 500;
+  }
+
+  const code = getStringProperty(error, 'code');
+  return (
+    code === 'server_error' ||
+    code === 'rate_limit_exceeded' ||
+    code === 'timeout'
+  );
+}
+
+function getNumericProperty(value: object, key: string): number | null {
+  if (!(key in value)) {
+    return null;
+  }
+
+  const property = value[key as keyof typeof value];
+  return typeof property === 'number' ? property : null;
+}
+
+function getStringProperty(value: object, key: string): string | null {
+  if (!(key in value)) {
+    return null;
+  }
+
+  const property = value[key as keyof typeof value];
+  return typeof property === 'string' ? property : null;
+}
+
+function sleepMs(ms: number): Promise<void> {
+  return new Promise((resolve) => {
+    setTimeout(resolve, ms);
+  });
+}