SOFA AI网关落地实践
一. 背景
网关作为重要的中间件,在传统业务中扮演着流量治理、路由转发、协议转换、安全防护等功能。根据不同业务场景的定位,也会衍生出不同类型的网关,例如流量网关、ESB(企业服务总线)、API网关、云原生网关。从网关职责看,其本质所承担的职责没有太多变化,主要是针对不同业务场景下作更多的适配,更好地满足业务使用。比如,API网关则是针对微服务场景,将原有的管理粒度从粗粒度的流量或服务,转换成了细粒度的REST或接口维度的管理,从而实现了更精细化的治理,这是从流量网关演变为API网关的核心驱动力。
在AI场景下,业务模式发生了根本性的变革,网关所面对的挑战也从“服务”转向了“模型”和“智...
CH3CHO | 2025-10-17
Higress AI 网关开发挑战赛参赛指引
大赛技术栈核心解读
1.1. 扩展 Higress:Go 与 Wasm 插件入门
插件是向 Higress 数据平面注入智能的核心机制。本次大赛的所有赛题,基本都需要通过编写或使用插件来实现。
WebAssembly (Wasm):安全、跨语言的沙箱技术
WebAssembly (Wasm) 是一种可移植的、运行在安全沙箱环境中的二进制指令格式。它允许使用 Go、Rust、C++ 等多种语言编写的代码,安全地运行在像 Envoy/Higress 这样的宿主应用中 。
+ ProxyWasm 规范:这是一个为代理环境制定的标准应用二进制接口(ABI),它定义了 Wasm 模块如何与代理...
CH3CHO | 2025-10-14
Higress v2.1.8:30 项引擎更新 + 4 项控制台更新
01 Higress 引擎更新
本次发布概览
本次发布包含 30 项更新,涵盖了功能增强、Bug修复、性能优化等多个方面。
更新内容分布
+ 新功能: 13项
+ Bug修复: 7项
+ 重构优化: 5项
+ 文档更新: 4项
+ 测试改进: 1项
重点关注
本次发布包含 2 项重要更新,建议重点关注:
+ feat: add rag mcp server (): 通过引入RAG MCP服务器,为用户提供了一种新的方式来管理与检索知识,增强了系统的功能性和实用性。
+ refactor(mcp): use ECDS for golang filter configuratio...
CH3CHO | 2025-10-14
分布式 Multi Agent 安全高可用探索与实践
作者:亦盏
在人工智能加速发展的今天,AI Agent 正在成为推动“人工智能+”战略落地的核心引擎。无论是技术趋势还是政策导向,都预示着一场深刻的变革正在发生。
最近,国务院印发《关于深入实施“人工智能+”行动的意见》,明确提出:到2027年,新一代智能终端和智能体普及率将超过70%;2030年突破90%,智能经济将成为我国经济发展的重要增长极;到2035年,全面步入智能经济与智能社会新阶段。
这一系列目标的背后,正是以 AI Agent 为核心的技术体系逐步走向成熟并大规模落地的信号。
OpenAI 创始人 Andrej Karpathy 曾提出一个经典的三段论,用以描述软...
CH3CHO | 2025-10-10
一等奖6万,Higress AI 网关开发挑战赛正式上线
报名地址:https://competition.atomgit.com/competitionInfo?id=c16f796963021f21711ad25819c664b4heading00
一、赛项简介
(一) 赛项背景
随着生成式人工智能(Generative AI)技术的飞速发展,大型语言模型(LLM)正逐步成为现代软件架构的核心。这一变革对底层基础设施提出了全新的要求,特别是作为流量入口和策略执行核心的API网关。传统的API网关主要负责请求路由、认证鉴权和流量控制,但在AI时代,其角色必须演进为“AI网关”,以原生方式支持和加速AI应用。
Higress是一款基于En...
CH3CHO | 2025-10-10
近期 AI 领域的新发布所带来的启示
作者:望宸
2024 年以来,AI 基础设施的快速发展过程中,PaaS 层的 AI 网关是变化最明显的基建之一。从传统网关的静态规则和简单路由开始,网关的作用被不断拉伸。用户通过使用网关来实现多模型的流量调度、智能路由、Agent 和 MCP 服务管理、AI 治理等,试图让系统更灵活、更可控、更可用。
国庆期间 AI 界发布/升级了一些产品,我们在此做一个简报,从中窥探下对 AI 网关演进新方向的启示。
一、自由度更高的低门槛后训练工具
OpenAI 前 CTO Mira Murati 创建的 Thinking Machines Lab 发布了其第一款产品「Tinker」,旨在...
CH3CHO | 2025-10-10
云原生进化论:加速构建 AI 应用
大家好,我是来自阿里云智能集团的资深产品专家杨秋弟,今天很荣幸能在云栖大会的场合,和大家分享过去一年我们在支持企业构建 AI 应用过程的一些实践和思考。
01 智能体应用已成为应用架构中的重要组成部分
从事 AI 领域的同仁,无论是科研学者,落地 AI 的企业,还是提供 AI 技术或产品的供应端企业,我想大家都有非常一致的体感,就是 AI 应用的发展是势不可挡的,并正在重塑软件行业,我们来看几组数据:
+ 模型调用增速爆发: GenAI 的支出增长尤其迅猛,预计将从 2023 年的 160 亿美元增长到 2027 年的 1430 亿美元,年均复合增长率(CAGR)高达 73.3%。
...
CH3CHO | 2025-10-10
云栖热词:AI 原生
AI 原生不再是一个新的概念,而是企业在业务落地实践过程中已经形成的共识。不论是技术团队还是业务部门,都认同 AI 原生已经成为了应用架构的新范式。但是,围绕 AI 原生究竟涵盖哪些核心要素,因岗位视角不同、落地阶段不同、应用场景不同,仍有不同的理解:有强调模型和数据的,有更关注上下文工程与工具调用的,也有聚焦可观测、安全与治理的。
阿里云智能资深技术专家简志在“云栖大会 AI 基础设施进化论坛”分享了团队的实践感悟,包括从云原生到 AI 原生的演进路线,AI 原生所包含的关键要素,以及未来的发展方向,希望对参与 AI 建设的所有同行者们有所启发。
01 云原生到 AI 原生的演进路...
CH3CHO | 2025-10-10
解读阿里云发布的《AI 原生应用架构白皮书》
作者: 彦林、麻芃、望宸
阿里云在云栖大会重磅发布了《AI 原生应用架构白皮书》,该白皮书覆盖 AI 原生应用的 11 大关键要素,获得业界 15 位专家联名推荐,来自 40 多位一线工程师实践心得,全书合计超 20w 字,分为 11 章,全面、系统地解构 AI 原生应用架构,包含了 AI 原生应用的 11 大关键要素,模型、框架、提示词、RAG、记忆、工具、网关、运行时、可观测、评估和安全。本文整理自阿里云智能技术专家李艳林在云栖大会现场的解读。
为什么要写《AI 原生应用架构白皮书》?
ChatGPT 迈过智能拐点后,大模型按照 Scaling Law 法则不断刷新智...
CH3CHO | 2025-09-28
阿里云发布《AI 原生应用架构白皮书》
不同于传统软件开发通过编程与算法构建的确定性逻辑,AI 时代的应用构建以面对自然语言编程、上下文工程为核心特征,将复杂业务逻辑与决策过程下沉至模型推理环节,从而实现业务的智能化自适应。
然而,AI 应用开发过程中仍面临诸多挑战,例如开发阶段强依赖模型黑盒特性,导致结果可控性不足、幻觉问题频发,从原型验证(PoC)到生产部署往往需要数月调优,核心痛点集中在调试效率与业务适配;上线后则面临推理延迟、稳定性波动、问题排查困难、安全风险凸显、输出不可靠及成本过高等问题,折射出企业级 AI 应用在稳定性、性能、安全与成本控制上的系统性挑战。
针对此,阿里云联合阿里巴巴爱橙科技,共同发...
CH3CHO | 2025-09-25