Z-Image-Turbo部署教程：Kubernetes集群中高可用文生图服务编排方案

本文介绍了如何在星图GPU平台上自动化部署Z-Image-Turbo极速云端创作室镜像，快速搭建高可用文生图服务。该方案基于Kubernetes集群，可实现服务的弹性伸缩与集中管理。部署后，用户可通过Web界面或API，在数秒内快速生成高质量的概念设计图、营销海报等创意图片，极大提升团队内容创作效率。

Neo-ke

348人浏览 · 2026-03-22 07:01:39

Neo-ke · 2026-03-22 07:01:39 发布

Z-Image-Turbo部署教程：Kubernetes集群中高可用文生图服务编排方案

1. 引言：为什么要在K8s上部署文生图服务？

想象一下，你的团队需要频繁生成高质量的概念设计图、营销海报或者游戏美术素材。每次都要手动启动一个AI绘图应用，等待它加载模型，然后才能开始工作。如果同时有多个同事需要使用，要么排队等待，要么就得准备好几台昂贵的显卡服务器。

这显然不是高效的现代工作方式。

今天，我要带你部署的 Z-Image-Turbo 解决方案，就是为了解决这个问题而生。它不是一个简单的单机应用，而是一个可以直接运行在Kubernetes集群上的、高可用的文生图服务。部署完成后，你的团队可以通过一个统一的Web界面，随时提交绘图任务，系统会自动调度资源，在几秒钟内返回高清图片。

这个方案的核心价值在于三个词：高可用、弹性伸缩、集中管理。无论你是个人开发者想搭建一个稳定的AI绘画服务，还是企业团队需要为几十个设计师提供绘图能力，这套方案都能很好地满足需求。

2. 方案核心：Z-Image-Turbo技术解析

在开始动手部署之前，我们先花几分钟了解一下Z-Image-Turbo到底强在哪里。知道了它的技术特点，你就能明白为什么它适合在Kubernetes环境中运行。

2.1 Turbo加速引擎：4步生成高清图

传统的Stable Diffusion模型生成一张1024x1024的图片，通常需要20到50步的迭代计算。每一步都需要模型进行复杂的数学运算，耗时较长。Z-Image-Turbo集成了SDXL Turbo同款的加速引擎，通过一种叫“对抗性扩散蒸馏”的技术，把生成步骤压缩到了仅仅4步。

这是什么概念？我用一个简单的对比来说明：

传统模型：生成一张图需要5-10秒（20-50步）
Z-Image-Turbo：生成同样质量的图只需要1-2秒（4步）

速度提升了3-5倍，但画质几乎没有损失。这对于需要快速响应的在线服务来说，是至关重要的优势。

2.2 BFloat16精度与零黑图保障

如果你之前部署过其他AI绘图模型，可能遇到过“黑图”问题——生成的图片全是黑色的，或者色彩严重失真。这通常是因为模型在计算过程中出现了数值溢出。

Z-Image-Turbo从根源上解决了这个问题。它采用bfloat16精度来加载和运行模型，而不是常见的fp16。bfloat16在保持足够精度的同时，有更宽的数值表示范围，就像给计算过程加了一个“安全护栏”，确保不会因为数值过大或过小而崩溃。

2.3 序列化CPU卸载策略

这是让服务能够稳定运行7x24小时的关键技术。简单来说，这个策略会智能地管理GPU显存的使用：

按需加载：只有当某个模型层需要计算时，才把它从CPU内存加载到GPU显存
及时释放：计算完成后，立即把这一层从显存中卸载，腾出空间给下一层
动态调度：系统会监控显存使用情况，自动调整加载策略

这样做的好处很明显：显存占用极低，稳定性极高。即使你的显卡只有8GB显存，也能流畅运行这个需要大量计算资源的模型。

3. 环境准备与Kubernetes部署

现在我们来进入实战环节。我会带你一步步在Kubernetes集群中部署Z-Image-Turbo服务。无论你是用云服务商的托管K8s（如阿里云ACK、腾讯云TKE），还是自己搭建的集群（如使用kubeadm），这套方案都适用。

3.1 前置条件检查

在开始之前，请确保你的环境满足以下要求：

Kubernetes集群：版本1.20及以上，至少有一个节点配备GPU
NVIDIA GPU驱动：所有GPU节点已安装相应版本的驱动
NVIDIA容器工具包：集群已安装nvidia-container-toolkit和nvidia-device-plugin
存储类：配置了可用的存储类（用于持久化模型文件）
镜像仓库：能够访问Docker Hub或你的私有镜像仓库

你可以用以下命令快速检查GPU支持情况：

# 检查节点GPU信息
kubectl describe nodes | grep -A 10 -B 5 "nvidia.com/gpu"

# 检查nvidia-device-plugin运行状态
kubectl get pods -n kube-system | grep nvidia-device-plugin

如果看到GPU资源显示正常，并且nvidia-device-plugin运行中，说明环境准备就绪。

3.2 创建命名空间和配置

我们先为这个服务创建一个独立的命名空间，这样便于管理：

# namespace.yaml
apiVersion: v1
kind: Namespace
metadata:
  name: z-image-turbo

应用这个配置：

kubectl apply -f namespace.yaml

接下来，我们需要创建一个ConfigMap来存储应用配置。虽然Z-Image-Turbo的Web界面参数已经优化好了，但我们还是可以通过配置调整一些行为：

# configmap.yaml
apiVersion: v1
kind: ConfigMap
metadata:
  name: z-image-turbo-config
  namespace: z-image-turbo
data:
  # Web服务配置
  WEB_PORT: "8080"
  WEB_HOST: "0.0.0.0"
  
  # 模型生成参数（已优化，一般无需修改）
  NUM_INFERENCE_STEPS: "4"
  GUIDANCE_SCALE: "1.5"
  
  # 资源限制
  MAX_CONCURRENT_REQUESTS: "10"
  REQUEST_TIMEOUT: "30"

3.3 部署模型服务

这是最核心的部分。我们将创建一个Deployment来运行Z-Image-Turbo服务，并使用Service暴露它。

# deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: z-image-turbo
  namespace: z-image-turbo
  labels:
    app: z-image-turbo
spec:
  replicas: 1  # 初始副本数，可根据需求调整
  selector:
    matchLabels:
      app: z-image-turbo
  template:
    metadata:
      labels:
        app: z-image-turbo
    spec:
      # 节点选择器：确保Pod调度到有GPU的节点
      nodeSelector:
        accelerator: nvidia-gpu
      
      containers:
      - name: z-image-turbo
        image: csdnmirrors/see-see21-z-image:latest
        ports:
        - containerPort: 8080
          name: web
        envFrom:
        - configMapRef:
            name: z-image-turbo-config
        resources:
          limits:
            # GPU资源请求，根据实际显卡调整
            nvidia.com/gpu: "1"
            memory: "8Gi"
            cpu: "4"
          requests:
            nvidia.com/gpu: "1"
            memory: "4Gi"
            cpu: "2"
        # 健康检查
        livenessProbe:
          httpGet:
            path: /health
            port: 8080
          initialDelaySeconds: 30
          periodSeconds: 10
        readinessProbe:
          httpGet:
            path: /ready
            port: 8080
          initialDelaySeconds: 20
          periodSeconds: 5
        # 挂载点，用于缓存模型文件
        volumeMounts:
        - name: model-cache
          mountPath: /root/.cache
      volumes:
      - name: model-cache
        persistentVolumeClaim:
          claimName: z-image-turbo-pvc

注意上面的nodeSelector部分，你需要确保你的GPU节点有这个标签。如果没有，可以给节点打标签：

# 给GPU节点打标签
kubectl label nodes <你的GPU节点名> accelerator=nvidia-gpu

3.4 创建持久化存储

模型文件比较大，我们不想每次重启都重新下载，所以需要持久化存储：

# pvc.yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: z-image-turbo-pvc
  namespace: z-image-turbo
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 20Gi  # 根据实际需要调整大小
  storageClassName: standard  # 改成你的存储类名称

3.5 暴露服务

现在创建Service，让我们的应用可以被访问：

# service.yaml
apiVersion: v1
kind: Service
metadata:
  name: z-image-turbo-service
  namespace: z-image-turbo
spec:
  selector:
    app: z-image-turbo
  ports:
  - port: 80
    targetPort: 8080
    name: http
  type: ClusterIP  # 内部访问，如果需要外部访问可以改为NodePort或LoadBalancer

如果你想让外部也能访问，可以改为NodePort：

# 或者使用NodePort（外部访问）
apiVersion: v1
kind: Service
metadata:
  name: z-image-turbo-service-external
  namespace: z-image-turbo
spec:
  selector:
    app: z-image-turbo
  ports:
  - port: 80
    targetPort: 8080
    nodePort: 30080  # 30000-32767之间的端口
  type: NodePort

3.6 一键部署脚本

我把上面的步骤整理成了一个脚本，你可以直接运行：

#!/bin/bash
# deploy-z-image-turbo.sh

echo "开始部署Z-Image-Turbo到Kubernetes集群..."

# 1. 创建命名空间
kubectl apply -f namespace.yaml

# 2. 创建配置
kubectl apply -f configmap.yaml

# 3. 创建持久化存储
kubectl apply -f pvc.yaml

# 4. 部署应用
kubectl apply -f deployment.yaml

# 5. 创建服务
kubectl apply -f service.yaml

# 等待Pod启动
echo "等待Pod启动..."
sleep 10

# 检查部署状态
kubectl get pods -n z-image-turbo -w

运行这个脚本后，用下面的命令检查部署状态：

# 查看Pod状态
kubectl get pods -n z-image-turbo

# 查看服务信息
kubectl get svc -n z-image-turbo

# 查看Pod日志
kubectl logs -f deployment/z-image-turbo -n z-image-turbo

当Pod状态显示为Running，并且日志中出现类似Application startup complete的信息时，说明部署成功了。

4. 高可用与弹性伸缩配置

单副本部署只能满足基本需求。在实际生产环境中，我们需要考虑高可用和弹性伸缩。下面我来介绍如何让这个服务更加健壮。

4.1 多副本部署

首先，我们可以增加副本数来提高可用性。修改之前的Deployment：

# deployment-ha.yaml（高可用版本）
apiVersion: apps/v1
kind: Deployment
metadata:
  name: z-image-turbo-ha
  namespace: z-image-turbo
spec:
  replicas: 2  # 两个副本
  selector:
    matchLabels:
      app: z-image-turbo
  template:
    metadata:
      labels:
        app: z-image-turbo
    spec:
      # 添加反亲和性，让Pod尽量分散在不同节点
      affinity:
        podAntiAffinity:
          preferredDuringSchedulingIgnoredDuringExecution:
          - weight: 100
            podAffinityTerm:
              labelSelector:
                matchExpressions:
                - key: app
                  operator: In
                  values:
                  - z-image-turbo
              topologyKey: kubernetes.io/hostname
      # 其他配置保持不变...

反亲和性配置的作用是：尽量让两个Pod运行在不同的节点上。这样即使一个节点故障，另一个节点上的Pod还能继续服务。

4.2 水平自动伸缩（HPA）

当请求量增加时，我们希望能自动扩容；请求量减少时，自动缩容。这可以通过Horizontal Pod Autoscaler实现：

# hpa.yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: z-image-turbo-hpa
  namespace: z-image-turbo
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: z-image-turbo
  minReplicas: 1
  maxReplicas: 5  # 最大扩展到5个副本
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70  # CPU使用率超过70%时扩容
  - type: Resource
    resource:
      name: memory
      target:
        type: Utilization
        averageUtilization: 80  # 内存使用率超过80%时扩容

应用这个配置后，Kubernetes会监控Pod的资源使用情况，自动调整副本数量。

4.3 使用Ingress暴露服务

如果你有多个服务需要对外提供，或者需要配置域名、SSL证书，可以使用Ingress：

# ingress.yaml
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: z-image-turbo-ingress
  namespace: z-image-turbo
  annotations:
    # 使用nginx-ingress-controller
    nginx.ingress.kubernetes.io/proxy-body-size: "50m"  # 允许上传大图片
    nginx.ingress.kubernetes.io/proxy-read-timeout: "300"
    nginx.ingress.kubernetes.io/proxy-send-timeout: "300"
spec:
  ingressClassName: nginx
  rules:
  - host: ai-draw.yourdomain.com  # 改成你的域名
    http:
      paths:
      - path: /
        pathType: Prefix
        backend:
          service:
            name: z-image-turbo-service
            port:
              number: 80

这样，用户就可以通过https://ai-draw.yourdomain.com访问你的文生图服务了。

5. 使用与测试：快速生成你的第一张AI图片

服务部署好了，现在我们来测试一下。我会带你通过几种不同的方式使用这个服务。

5.1 通过Web界面使用

这是最简单的方式。根据你的Service类型，访问方式不同：

如果是ClusterIP：在集群内部访问，或者通过kubectl port-forward转发到本地：
```
kubectl port-forward svc/z-image-turbo-service -n z-image-turbo 8080:80
```
然后在浏览器访问 http://localhost:8080
如果是NodePort：直接访问任意节点的IP和端口：
```
http://<节点IP>:30080
```
如果是LoadBalancer或Ingress：直接访问配置的域名或IP

打开界面后，你会看到一个简洁的绘图界面。在左侧输入框中，用英文描述你想要生成的画面，然后点击"极速生成"按钮。

一些实用的提示词示例：

电影级场景：Cinematic shot of a cyberpunk city at night, neon lights, rain on streets, 8k ultra detailed
自然风景：A serene mountain lake at sunrise, mist over water, pine trees, photorealistic, national geographic style
人物肖像：Portrait of an elegant elf queen with silver hair, intricate jewelry, fantasy art, detailed face, art by greg rutkowski

5.2 通过API接口调用

对于开发者来说，通过API调用更加灵活。服务提供了RESTful API：

# 示例：Python调用API生成图片
import requests
import base64
from io import BytesIO
from PIL import Image

# API地址（根据你的实际地址修改）
API_URL = "http://<你的服务地址>/api/generate"

def generate_image(prompt, save_path="output.png"):
    """调用API生成图片并保存"""
    
    # 准备请求数据
    payload = {
        "prompt": prompt,
        "negative_prompt": "blurry, low quality, distorted",  # 可选：不希望出现的元素
        "num_inference_steps": 4,  # Turbo模式固定4步
        "guidance_scale": 1.5,     # 固定参数
        "width": 1024,
        "height": 1024
    }
    
    # 发送请求
    response = requests.post(API_URL, json=payload, timeout=30)
    
    if response.status_code == 200:
        # 解析返回的图片数据
        result = response.json()
        image_data = base64.b64decode(result["image"])
        
        # 保存图片
        image = Image.open(BytesIO(image_data))
        image.save(save_path)
        print(f"图片已保存到: {save_path}")
        return image
    else:
        print(f"请求失败: {response.status_code}")
        print(response.text)
        return None

# 使用示例
if __name__ == "__main__":
    prompt = "A cute robot reading a book in a library, warm lighting, detailed illustration"
    generate_image(prompt, "robot_reading.png")

5.3 批量生成脚本

如果你需要批量生成图片，可以写一个简单的脚本：

# batch_generate.py
import requests
import json
import time
from concurrent.futures import ThreadPoolExecutor

class BatchImageGenerator:
    def __init__(self, api_url, max_workers=3):
        self.api_url = api_url
        self.max_workers = max_workers
    
    def generate_single(self, prompt, index):
        """生成单张图片"""
        try:
            payload = {
                "prompt": prompt,
                "num_inference_steps": 4,
                "guidance_scale": 1.5
            }
            
            start_time = time.time()
            response = requests.post(self.api_url, json=payload, timeout=60)
            elapsed = time.time() - start_time
            
            if response.status_code == 200:
                print(f"[{index}] 生成成功 - 耗时: {elapsed:.2f}秒 - 提示词: {prompt[:50]}...")
                return response.json()
            else:
                print(f"[{index}] 生成失败: {response.status_code}")
                return None
                
        except Exception as e:
            print(f"[{index}] 请求异常: {str(e)}")
            return None
    
    def batch_generate(self, prompts):
        """批量生成图片"""
        print(f"开始批量生成 {len(prompts)} 张图片...")
        
        with ThreadPoolExecutor(max_workers=self.max_workers) as executor:
            # 提交所有任务
            futures = []
            for i, prompt in enumerate(prompts):
                future = executor.submit(self.generate_single, prompt, i)
                futures.append(future)
            
            # 等待所有任务完成
            results = []
            for future in futures:
                results.append(future.result())
        
        print("批量生成完成!")
        return results

# 使用示例
if __name__ == "__main__":
    # 你的API地址
    API_URL = "http://<你的服务地址>/api/generate"
    
    # 准备提示词列表
    prompts = [
        "A futuristic city floating in the clouds, sunset, 8k detailed",
        "An ancient dragon sleeping on a treasure hoard, fantasy art",
        "A cozy cottage in a magical forest, fairytale style",
        "An astronaut riding a horse on Mars, surreal art",
        "A steampunk laboratory with intricate machinery"
    ]
    
    # 创建生成器并执行
    generator = BatchImageGenerator(API_URL, max_workers=2)
    results = generator.batch_generate(prompts)

6. 监控、维护与故障排查

服务上线后，我们需要确保它稳定运行。这部分我会介绍如何监控服务状态，以及遇到常见问题怎么解决。

6.1 监控指标收集

首先，我们可以给服务添加监控指标。修改Deployment，添加Prometheus注解：

# 在Deployment的template.metadata.annotations中添加
template:
  metadata:
    annotations:
      prometheus.io/scrape: "true"
      prometheus.io/port: "8080"
      prometheus.io/path: "/metrics"

然后创建一个简单的监控面板配置：

# service-monitor.yaml
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: z-image-turbo-monitor
  namespace: z-image-turbo
spec:
  selector:
    matchLabels:
      app: z-image-turbo
  endpoints:
  - port: web
    interval: 30s
    path: /metrics

6.2 关键监控指标

你需要关注以下几个关键指标：

请求延迟：生成一张图片的平均时间
请求成功率：成功响应的比例
GPU使用率：确保没有过载
内存使用：防止OOM（内存溢出）
Pod重启次数：频繁重启可能有问题

6.3 常见问题与解决方案

问题1：Pod一直处于Pending状态

可能原因和解决方案：

# 查看Pod详情
kubectl describe pod <pod-name> -n z-image-turbo

# 常见原因1：节点资源不足
# 解决方案：检查节点资源，或增加节点

# 常见原因2：PVC无法绑定
# 解决方案：检查StorageClass和PV配置

# 常见原因3：节点选择器不匹配
# 解决方案：检查nodeSelector配置，确保节点有相应标签

问题2：服务能访问，但生成图片失败

排查步骤：

# 1. 查看Pod日志
kubectl logs -f <pod-name> -n z-image-turbo

# 2. 常见错误：模型下载失败
# 解决方案：检查网络连接，或提前下载模型到镜像

# 3. 常见错误：显存不足
# 解决方案：检查GPU资源分配，或减少并发数

问题3：生成速度变慢

可能原因：

GPU温度过高：检查节点GPU温度
内存不足：检查内存使用情况
磁盘IO瓶颈：如果使用网络存储，可能会有延迟

解决方案：

# 查看节点资源使用
kubectl top nodes
kubectl top pods -n z-image-turbo

# 如果资源不足，考虑：
# 1. 增加资源限制
# 2. 减少并发请求数
# 3. 增加Pod副本数分散负载

6.4 日常维护命令

这里是一些常用的维护命令：

# 查看服务状态
kubectl get all -n z-image-turbo

# 查看Pod日志
kubectl logs -f deployment/z-image-turbo -n z-image-turbo

# 进入Pod调试
kubectl exec -it <pod-name> -n z-image-turbo -- /bin/bash

# 重启服务
kubectl rollout restart deployment/z-image-turbo -n z-image-turbo

# 查看事件
kubectl get events -n z-image-turbo --sort-by='.lastTimestamp'

# 资源使用情况
kubectl top pods -n z-image-turbo
kubectl top nodes

7. 总结与最佳实践建议

通过上面的步骤，你应该已经成功在Kubernetes集群中部署了一个高可用的Z-Image-Turbo文生图服务。让我总结一下关键要点，并给出一些最佳实践建议。

7.1 部署要点回顾

环境准备是关键：确保Kubernetes集群正确配置了GPU支持，这是服务能正常运行的基础。
资源配置要合理：根据你的实际需求调整GPU、CPU和内存的请求与限制。太少的资源会导致服务不稳定，太多的资源会造成浪费。
持久化存储很重要：模型文件很大，使用持久化存储可以避免每次重启都重新下载，大大加快启动速度。
高可用不是可选项：对于生产环境，一定要配置多副本和反亲和性，确保单个节点故障不会影响服务。
监控不能少：配置基本的监控和告警，这样出现问题能及时发现和处理。

7.2 性能优化建议

根据我的经验，这里有一些优化建议：

资源分配优化：

# 根据实际负载调整这些值
resources:
  limits:
    nvidia.com/gpu: "1"    # 一张显卡
    memory: "8Gi"          # 8GB内存通常足够
    cpu: "4"               # 4个CPU核心
  requests:
    nvidia.com/gpu: "1"
    memory: "6Gi"          # 请求比限制稍少，便于调度
    cpu: "2"

并发控制：

单个Pod建议并发数不要超过3-5个请求
如果请求量大，通过增加Pod副本数来扩展，而不是提高单个Pod的并发数

模型预热：可以在Pod启动后自动发送几个简单的请求来预热模型，这样第一个真实请求就不会有冷启动延迟。

7.3 安全考虑

网络隔离：使用NetworkPolicy限制只有必要的服务能访问文生图服务
访问控制：如果服务对外公开，考虑添加基本的认证机制
内容审核：对于公开服务，建议添加内容审核层，过滤不适当的生成请求
资源限制：设置每个用户/每个IP的请求频率限制，防止滥用

7.4 成本控制

云上GPU资源很贵，这里有一些节省成本的建议：

使用抢占式实例：如果服务不是7x24小时需要，可以使用更便宜的抢占式实例
自动伸缩：根据流量自动调整副本数，低峰期减少副本节省成本
混合部署：将Web前端和API网关部署在CPU节点，只有模型推理用GPU节点
缓存结果：对于相同的提示词，可以缓存生成结果，避免重复计算

7.5 扩展思路

这个基础部署方案可以进一步扩展：

多模型支持：部署多个不同的文生图模型，让用户可以选择
任务队列：引入消息队列处理大量生成请求，避免服务过载
结果存储：将生成的图片保存到对象存储，并提供管理界面
用户系统：添加用户管理、积分系统、历史记录等功能
模型微调：允许用户上传自己的图片训练个性化模型

部署完成后，你的团队就拥有了一个稳定、高效、可扩展的AI绘图服务。无论是日常的设计工作，还是临时的批量生成需求，都能得到快速响应。

最重要的是，这个方案把复杂的AI模型部署和管理工作标准化、自动化了。你不再需要手动在每台机器上安装配置，所有的扩缩容、故障恢复、监控告警都由Kubernetes自动处理。

技术应该服务于业务，而不是成为业务的负担。通过这套方案，你可以让团队更专注于创意和内容本身，而不是底层的基础设施。这就是云原生和AI结合带来的真正价值。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

开源鸿蒙跨平台开发者社区

开源鸿蒙跨平台开发社区汇聚开发者与厂商，共建“一次开发，多端部署”的开源生态，致力于降低跨端开发门槛，推动万物智联创新。

更多推荐

React Native跨平台鸿蒙开发实战系列：输入表单如何适配任何机型，总是占据页面下部分

开源鸿蒙跨平台开发者社区

鸿蒙三方库实战指南：从安装到核心功能的深度解析

ohos/axios 作为 axios 在鸿蒙平台的官方适配版本，不仅完整保留了 Web 端 axios 的 Promise 化 API、拦截器、请求取消等核心特性，更针对鸿蒙的网络权限机制、沙箱文件系统进行了深度优化，是当前社区使用最广泛的网络请求库 —— 其在 OpenHarmony 三方库中心仓的月下载量已连续 12 个月突破 10 万次。@ohos/axios 的核心功能与 Web 端