GaGa's Blog

One GaGa, One World !

1.OP 技术支持的含义

OP 技术支持里的 OP,在技术与企业语境中,几乎可以确定是 Operations(运维 / 运营) 的缩写。

1.1 核心定义
OP 技术支持 = 围绕系统运行全生命周期的技术保障能力
目标只有一个:
稳定、可用、可恢复、可扩展

1.2 OP 与其他角色的边界

Read more »

1. 什么是 Charles**

cd518a8ef40416787808cc7ffd95e2af.png

1.1. Charles 是一款跨平台的 Web 调试代理(Web Debugging Proxy) 软件,它在 Windows、macOS 和 Linux 上运行,允许开发者捕获并分析从本机发出的所有网络请求和响应,包括 HTTP、HTTPS/SSL 等通信内容。它基本上在你的设备与外部服务器之间充当“中间人”,可以让你看到浏览器或客户端和服务器之间实际传输的每一个字节。

Read more »

1. ONNX Runtime CUDA Provider概述

1.1. 它是什么
ONNX Runtime(ORT)是一个高性能推理引擎,CUDA Provider 是它的 GPU 执行后端之一,用来把 ONNX 模型的计算图映射到 NVIDIA GPU 上执行。简单说:模型还是 ONNX,但算力来自 CUDA。它并不是“重写模型”,而是把算子(Conv、Gemm、Attention 等)交给 CUDA / cuDNN / cuBLAS 去跑。

1.2. 它解决什么问题
CPU 推理在吞吐和延迟上很快会撞天花板。CUDA Provider 的价值在于:

  • 把计算密集型算子下放到 GPU
  • 复用 NVIDIA 已经高度优化的数学库
  • 在不改模型、不改业务代码的前提下获得数量级的性能提升
Read more »

问题

1.日志如下

File "/opt/conda/lib/python3.10/site-packages/transformers/modeling_utils.py", line 3613, in from_pretrained verificationservice | with safe_open(resolved_archive_file, framework="pt") as f:

safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge
  1. 问题本质判断
    1.1 这是 safetensors 在反序列化模型文件头部时失败 的错误,而不是 CUDA、PyTorch 或 Transformers 的运行期错误
    1.2 HeaderTooLarge 的含义很直白:模型文件的 safetensors 头信息异常地“大”或“损坏”,以至于解析器直接拒绝
    1.3 该错误发生在 safe_open(..., framework="pt") 阶段,说明 模型尚未真正加载进内存
Read more »

1. OpenSTF 是什么

1.1. OpenSTF(Smartphone Test Farm)是一套开源的 Android 真机管理与远程调试平台

1.2. 目标很纯粹:把一堆散落在机柜里的 Android 手机,变成 可共享、可观测、可自动化接入的“设备云”

1.3. 核心使用场景

Read more »

1. Redroid 是什么

1.1 定义
Redroid(Remote Android)是一种 基于容器的 Android 运行环境,本质上是把 Android OS 作为一个“可被远程访问、可批量调度的系统进程”,跑在 Linux Server 上,而不是传统手机或模拟器里。
它更像“Android-as-a-Service”,不是给人点屏幕用的,而是给系统、脚本、平台用的。

1.2 设计哲学
Redroid走的是一条很工程化的路线:

  • 不做完整硬件模拟(避开 QEMU 那一套)
  • 直接复用宿主机 Linux Kernel
  • 用容器隔离 + Binder/ashmem 等 Android 关键机制
    这让它在 密度、启动速度、自动化友好度 上碾压传统模拟器。
Read more »

1. 什么是ELRepo(Enterprise Linux Repository)

它是一个面向 企业级 Linux 发行版(Enterprise Linux)的第三方 RPM 软件仓库,主要用于 Red Hat Enterprise Linux(RHEL)及其衍生版如 CentOS、Scientific Linux、AlmaLinux 等系统。ELRepo 的目标是补充官方仓库,在硬件驱动和内核等方面提供额外的支持与更新,这些内容在官方仓库中往往比较保守或没有提供。

2. ELRepo 的定位与作用

Read more »

AliSecGuard 是阿里云的 内核安全模块,本质上就是一个云厂商级的 内核防护 Agent(没法卸载),它负责监控和保护主机,包括入侵检测、完整性校验、关键系统调用监控等。

1
2
3
4
5
1241.896537] AliSecGuard: module verification failed: signature and/or required key missing - tainting kernel
[1241.897094] AliSecGuard : a130d12303ad1ffdfbd0eea01d79bdedea99d53a
[ 1241.970141] AliSecGuard : a130d12303ad1ffdfbd0eea01d79bdedea99d53a
[ 3224.580869] wireguard: wg0: Could not create IPv4 socket
[ 3224.581661] A link change request failed with some changes committed already. Interface wg0 may have been left with an inconsistent configuration, please check.

WireGuard 在创建 IPv4 socket 时被内核层“拦住了”,而拦截者高度疑似是 AliSecGuard(阿里云安全内核模块)

关键特点:

Read more »
0%