August 29, 2025
释放 RAG 潜能,用 AI 网关帮助 Dify 应用“开外挂”
作者:王灏廷、赵源筱
Dify 是一款开源的 AI 应用开发平台,旨在帮助开发者和非技术人员快速构建和运营基于生成式AI的应用。截至目前,Dify 开源 Star 数量已经突破 11 万,具有庞大的用户群体,已成为构建生成式 AI 应用的热门选择之一。
然而,随着 Dify 在实际生产实践中持续落地,根据云上客户以及社区反馈,其内置的 RAG 引擎逐渐暴露出复杂文本分块处理能力低、检索功能薄弱、配置不够简洁智能等问题,这些问题直接导致 Dify 内置 RAG 的召回质量不理想,进而影响了大模型生成内容的准确性与可靠性,难以满足企业级生产环境对高精度知识检索的需求。
为解决上述云上客户以...
August 25, 2025
携程旅游的 AI 网关落地实践
本文整理自携程旅游研发总监董艺荃在2025中国可信云大会上的分享,董艺荃 GitHub ID CH3CHO,同时也是 Higress 的 Maintainer。分享内容分为以下4部分。
· 大规模应用 AI 技术的过程中遇到了哪些问题
· 网关选型上有哪些考虑
· 落地 AI 网关时,有哪些难点和如何应对的
· 应用成效和未来规划
01 大规模应用 AI 技术的过程中遇到了哪些问题
为了进一步提升服务水平和服务质量,携程很早就开始在人工智能大模型领域进行探索。而随着工作的深入,大模型服务的应用领域不断扩大,公司内部需要访问大模型服务的应用也越来越多,不可避免的就遇到了下面这几个问...
August 19, 2025
Dify 性能瓶颈?Higress AI 网关为它注入「高可用之魂」!
作者:赵源筱、王灏廷
Dify 作为一款开源的 AI 应用开发平台,凭借其灵活的工作流编排和易用的界面,在社区和云上部署中获得了广泛的关注。在 github 上,Dify 平均日增 20 个左右 issue,在开源也具有较高的活跃度。
然而,随着 Dify 用户规模扩大、生产落地增加,Dify 应用在性能方面的问题也逐渐暴露,影响了用户体验和生产环境的稳定性。
针对 Dify 性能问题,本文将介绍如何使用 Higress AI 网关保证 Dify 应用的全链路高可用性,并给出操作实践指南。
Dify 应用性能问题
对于一个对外提供服务的 Dify AI 应用,能够正常运行的核心基础...
August 8, 2025
从体验到系统工程|上手评测国内首款 AI 电商 APP
作者:望宸
产品界面,往往体现了产品的设计哲学,界面是产品的第一入口。
近期,1688 推出了 1688 AI APP,这貌似是国内第一个电商领域的独立 AI APP 应用(若不是,欢迎评论指正)。本文试图通过产品界面这一入口,窥探其背后的系统工程。(笔者并非就职于 1688 团队,仅从一位 1688 普通用户的视角做些体验评测)。
1688 在 AI 领域的技术实践,推荐阅读阿里巴巴高级算法专家张进的这篇分享:
产品界面即用户认知:1688 APP 和 1688 AI APP 的不同
在软件产品的演化史中,首页界面往往折射出产品的设计哲学。对比 1688 App 和 ...
August 6, 2025
Higress v2.1.6:31 项引擎更新 + 12 项控制台更新
Higress
本次发布概览
本次发布包含 31 项更新,涵盖了功能增强、Bug修复、性能优化等多个方面。
更新内容分布
+ 新功能: 13项
+ Bug修复: 5项
+ 重构优化: 7项
+ 文档更新: 6项
重点关注
本次发布包含 2 项重要更新,建议重点关注:
+ feat: Add Higress API MCP server (): 新增的Higress API MCP服务器功能增强了AI Agent对Higress资源的管理能力,支持通过MCP进行路由和服务的增删改查操作,提升了系统的灵活性和可维护性。
+ Migrate WASM Go Plugins to ...
August 4, 2025
不增加 GPU,首 Token 延迟下降50%|LLM 服务负载均衡的新实践
作者:钰诚
简介
传统的负载均衡算法主要设计用于通用的Web服务或微服务架构中,其目标是通过最小化响应时间、最大化吞吐量或保持服务器负载平衡来提高系统的整体效率,常见的负载均衡算法有轮询、随机、最小请求数、一致性哈希等。然而,在面对LLM服务时,这些传统方法往往暴露出以下几个关键缺陷:
1. 忽略任务复杂度差异:LLM推理请求的复杂度差异极大。例如,一个长文本生成任务可能需要数十倍于短文本分类任务的计算资源。而传统负载均衡器无法感知这种差异,容易导致某些节点过载,而其他节点空闲,造成资源浪费和响应延迟。
2. 缺乏对GPU资源水位的感知:在LLM推理服务中,计算瓶颈主要集中在GPU上,...
August 4, 2025
Higress 入选《AI Cloud 大模型推理与交互典型案例》
中国信通院于2025年7月23日举办的2025年可信云大会大模型推理与信息交互分论坛上,携手阿里云、中兴通讯、网易数之帆、长亮科技等企业单位,共同发布了《人工智能云 AI 网关能力要求》标准,AI 网关能力要求概述如下,覆盖插件集管理、多模型适配能力、可观测性、模型服务集成能力、流量治理、安全防护、大模型工具信息交互支持七大能力板块。
同时,会上发布了 AI Cloud 大模型推理与交互典型案例,共7家案例入选,包含 Higress 服务的3家用户。
+ 携程:基于 AI 网关的大模型应用实践
+
+
July 24, 2025
Higress v2.1.5:41 项引擎更新 + 8 项控制台更新
Higress 引擎更新
本次发布概览
本次发布包含 41 项更新,涵盖了功能增强、Bug修复、性能优化等多个方面。
更新内容分布
+ 新功能: 19项
+ Bug修复: 14项
+ 重构优化: 2项
+ 文档更新: 6项
重点关注
本次发布包含 2 项重要更新,建议重点关注:
+ feat: add DB MCP Server execute, list tables, describe table tools (): 通过增加这些工具,用户能够更方便地管理和操作数据库,提高了系统的灵活性和可用性,使得数据库操作更加直观和高效。
+ feat: advanced load...
July 24, 2025
AI Gateway 分析:OpenRouter vs Higress
作者:望宸
在经典应用架构中,「网关」往往意味着对用户请求的统一接入、认证鉴权、流控、协议转换等功能,Nginx、Envoy、Kong 等网关项目便是这一类能力的典型代表。而无论是微服务架构,还是云原生架构,这类产品的使用逻辑相对清晰、选型依据也相对稳定。
但进入 AI 应用时代后,原本定义清晰的「网关」概念正在被重新塑造。例如近期较热的 OpenRouter,早期以 LLM MarketPlace 自居的产品,如今也开始将自己定位为 “AI Gateway”。
这标志着三个重要变化:
+ AI Gateway 的供应商类型更多元化了:不仅有公共云厂商,如阿里云 API 网关...