TierFlow

智能体时代的 Token 优化引擎

TierFlow 通过自研BrainNet-8B引擎实现Token调度与上下文管理,在保证效果的同时显著降低成本,释放AI 应用生产力

查看文档

BrainNet-8B类脑任务感知模型,驱动 Step 级精细调度

TierFlow自研的BrainNet-8B深度融合任务理解、复杂度评估、模型能力知识与动态路由,在每个step精准感知任务需求,动态选择最优模型与执行路径,帮助智能体显著降低Token成本。

技术白皮书
六层能力架构BrainNet-8B 从感知到决策的 step 级路由链路
8B Router
01

任务理解

识别任务意图、目标约束与关键信息。

Intent
02

复杂度评估

判断任务难度、资源需求与可执行风险。

Scope
03

上下文压缩

提取核心上下文,减少无效 token 消耗。

Context
04

模型能力映射

匹配不同模型的能力边界与优势区间。

Model
05

成本预测

预估调用成本、时延与成功率收益。

Cost
06

决策输出

输出最优模型、工具选择与执行路径。

Route
BrainNet-8B将六层能力合成为单次 step 路由决策
Task Router

Developer API

开发者接入

保持 OpenAI SDK 调用方式,只替换 baseURL,并把模型名设置为 auto。TierFlow 负责后续模型选择、重试和成本控制。

auto
tierflow-quickstart.ts
import OpenAI from 'openai';

const client = new OpenAI({
  baseURL: 'https://api.tierflow.ai/v1',
  apiKey: process.env.TIERFLOW_API_KEY,
});

const response = await client.chat.completions.create({
  model: 'auto',
  messages: [
    {
      role: 'user',
      content: 'Run this browser task and verify the result.',
    },
  ],
});

更高任务成功率,更低调用成本

TierFlow 会根据任务阶段、实时成本与可用性自动选择模型,在多阶段智能体任务中以更低成本达到更高完成率

动态模型组合按 step 匹配能力,不锁定单一厂商。
成本实时感知把预算、延迟、成功率纳入同一次决策。
上下文精炼减少无效 Token,让复杂任务更稳定。
PinchBench · OpenClaw 实测
Avg Score (%)Avg Cost (¥)70809007142128TierFlowSuccess 91.6%Cost ¥2.04BestClaude Opus 4.6Success 82.3%Cost ¥17.62Claude Sonnet 4.5Success 80.7%Cost ¥15.52GPT-5.4Success 80.65%Cost ¥9.72Claude Sonnet 4.6Success 80.0%Cost ¥10.88Claude Opus 4.5Success 79.2%Cost ¥23.49qwen3.5-27bSuccess 78.5%Cost ¥3.26MiniMax2.7Success 77.21%Cost ¥4.85Gemini 3.1 ProSuccess 75.9%Cost ¥8.27qwen3-max-thinkingSuccess 71.8%Cost ¥13.56Gemini 3 ProSuccess 70.7%Cost ¥26.17GLM-4.5-AirSuccess 68.69%Cost ¥0.41

TierFlow 成功率最高、成本更低,综合表现领先。

排行榜

Top 5
模型成功率成本
1TierFlow91.6%¥2.04
2Claude Opus 4.682.3%¥17.62
3Claude Sonnet 4.580.7%¥15.52
4GPT-5.480.65%¥9.72
5Claude Sonnet 4.680.0%¥10.88
¥2.04 平均任务成本

让TierFlow接管下一次模型选择

在生产智能体中接入 TierFlow,帮助你降低成本、提升效率、保障稳定,为你的智能体应用提供坚实的推理引擎。