April 1, 2025
Higress 开源 Remote MCP Server 托管方案,并将上线 MCP 市场
导读:MCP Server 的实施存在着诸多挑战,特别是在认证授权、服务可靠性和可观测性方面,Higress 作为 AI 原生的 API 网关,提供了完整的开源 MCP Server 托管解决方案。即将上线的 MCP 市场,将大幅降低开发者构建 MCP Server 的时间和人力成本。
01 从事实标准迈向行业标准
MCP(Model Context Protocol)协议的生态发展正以前所未有的速度推进。近期,两大关键事件标志着 MCP 已从事实标准迈向行业标准:一方面,OpenAI 正式宣布跟进 Anthropic 的 MCP 协议,另一方面,Anthropic 发布了新版本 MCP...
March 28, 2025
IngressNightmare:Ingress Nginx 再曝5个安全漏洞,可接管你的 K8s 集群
作者:望宸&魁予
是否还记得2022年 K8s Ingress Nginx 披露了的3个高危安全漏洞(CVE202125745, CVE202125746, CVE202125748),并在那一年宣布停止接收新功能 PR,专注修复并提升稳定性。但近期再次被披露5个安全漏洞,攻击者可利用安全漏洞,接管你的 K8s 集群,被业内称为_[1]_
目录:
_01_ 背景
_02_ Nginx Ingress 安全漏洞频出的根因:架构设计缺陷
_03_ 架构设计缺陷带来安全问题,还带来稳定性问题
_04_ 自建网关容易忽略的细节
_05_ Higress&MSE Ingress:...
March 27, 2025
Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现
此次官方发布的 Spring AI Alibaba OpenManus 实现,包含完整的多智能体任务规划、思考与执行流程,可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析,操作浏览器,执行代码等来完成复杂任务等。
项目源码及体验地址:
效果展示
话不多说,先看运行效果,以下是我们通过几个实际问答记录展示的 Spring AI Alibaba OpenManus 实际使用效果。
1. 打开百度浏览器,在搜索框输入:阿里巴巴最最近一周股价,根据搜索到的信息绘制最近一周的股价趋势图并保存到本地目录。
2. 我计划在接下来的五一劳动节假期到韩国旅...
March 24, 2025
大模型上下文协议 MCP 带来了哪些货币化机会
先带个货:
+ Higress 及其云产品 API 网关:正在和通义灵码合作,采用 SSE + Tool + Redis 的技术方案,已经上线 Higress MCP Server Hosting_[1]_,提供两方面能力,一是 Higress 作为平台提供 IO 简单的 Tool 能力,实现若干主流的外部应用的对接,用户也可以自行实现 IO 复杂的 Tool 能力;二是作为网关对 MCP Server 的访问进行身份验证、授权等方面的管控。
+ Nacos 即将发布 MCP Register 的相关能力,包括动态发现和管理 MCP Server,并且通过动态 Prompt 下发管理 MC...
March 20, 2025
Higress.ai 站点全新发布,轻松解锁 AI 新能力,开启全球服务!
随着大模型技术的快速发展,AI服务的规模化落地对底层基础设施提出了新需求。在讨论到大模型规模化和安全使用时,AI网关是非常重要的AI 基础设施关键组件之一。
AI网关是传统API网关面向大模型场景的深度演进,它在保障基础网关能力的同时,针对AI服务的特性进行了专项增强:
+ 场景特性适配:专门优化长连接、高并发、大带宽等传输需求,适配大模型服务的高延迟特性
+ 智能流量治理:支持多模型动态路由、智能负载均衡、API Key轮转调度、语义化请求缓存
+ 安全合规保障:内置内容安全过滤、Token配额管理、多级限流熔断等安全能力
+ 成本精细管控:提供调用审计分析、流量灰度分发、失败请求自动...
March 13, 2025
AI 网关代理LLMs最佳实践
作者:付宇轩(计缘)
DeepSeek/QWen普惠AI趋势
随着DeepSeek R1的横空出世,又一次点燃了原本已经有点冷淡的大语言模型市场和话题,并且快速成为了现象级,小到中小学生,大到父母辈都知道了中国出了一个叫DeepSeek的大语言模型。各个行业,各个企业又都开启了新一轮的AI赋能/改进业务的浪潮。工信部发文力推最新AI技术普惠应用,三家运营商全面接入DeepSeek。国务院国资委召开中央企业“AI+”专项行动深化部署会。种种现象都表名,在DeepSeek引发的“鲶鱼效应”下,AI热潮持续升温,各个企业都愿意花钱进行尝试,云厂商GPU形态,线下一体机形态,云厂商DS API形...
March 12, 2025
大模型 Token 的消耗可能是一笔糊涂账
作者:望宸
如果您正在部署大模型应用,务必提前和 CEO 打好预防针,大模型应用远不如 Web 应用在资源成本上那么可控。
经典的 Web 应用,例如电商、游戏、出行、新能源、教育和医疗等,CPU 的消耗是可控的,和应用的在线人数和登陆时长成正相关,如果计算资源突增,可能是运营团队在做活动,也可能是预期外的突发流量,通过服务器弹性扩容后,稳定一段时间就会缩容到平时的状态,后端所消耗的资源是可追踪、可管控的。但大模型的 token 消耗并不是。
目录
01 大模型 token 消耗和哪些因素有关
02 大模型 token 消耗的隐蔽性来源
03 Agent 的资源消耗账本...
March 11, 2025
大模型带火 API 后,分享我对 API 安全之认证鉴权的实践
前言
云原生API网关(以下简称网关)是云原生网关的升级版,除继承了原云原生网关的全部能力,为用户叠加了API管理的能力。API作为企业的重要数字资源,在给企业带来巨大便利的同时也带来了新的安全问题,一旦被攻击可能导致数据泄漏重大安全问题,从而给企业的业务发展带来极大的安全风险。
正是在这样的背景下,OpenAPI规范中针对API安全做了明确的定义和引导,以便用户可以安全的管理自己的API。
以下为openapi的定义:
An OpenAPI file allows you to describe your entire API, including:
+ Available en...
March 10, 2025
大模型无缝切换,QwQ-32B 和 DeepSeek-R1 全都要
近期,通义千问发布最新推理模型 QwQ32B。
在各类基准测试中,拥有 320 亿参数的 QwQ 模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeekR1 媲美。这意味着:
+ 个人用户可以在更小的移动设备上、本地就能运行。
+ 企业用户推理大模型 API 的调用成本,可再降 90%。
价格对比:
如果是通过调用官方 API 的方式:
DeepSeek R1:$0.14/M 输入, $2.19/M 输出
QwQ32B:$0.20/M 输入, $0.20/M 输出
如果是通过云上自建的方式,例如阿里云 PAI:
DeepS...