GaGa's Blog

1.check

env

centos7.9
docker-ce-v1.13

1.1stop && disable

1.OP 技术支持的含义

OP 技术支持里的 OP，在技术与企业语境中，几乎可以确定是 Operations（运维 / 运营） 的缩写。

1.1 核心定义
OP 技术支持 = 围绕系统运行全生命周期的技术保障能力
目标只有一个：
稳定、可用、可恢复、可扩展

1.2 OP 与其他角色的边界

Charles4.6.8安装及破解

Posted on 2026-01-29

env

mac-2021 arm1
charles-v4.6.8

1.安装

1. 什么是 Charles**

https://www.charlesproxy.com/

1.1. Charles 是一款跨平台的 Web 调试代理（Web Debugging Proxy） 软件，它在 Windows、macOS 和 Linux 上运行，允许开发者捕获并分析从本机发出的所有网络请求和响应，包括 HTTP、HTTPS/SSL 等通信内容。它基本上在你的设备与外部服务器之间充当“中间人”，可以让你看到浏览器或客户端和服务器之间实际传输的每一个字节。

应用实时监控服务ARMS(Application Real-Time Monitoring Service)

https://help.aliyun.com/zh/arms

开启arms

ONNX Runtime CUDA Provider概述

Posted on 2026-01-28 Edited on 2026-01-29

1. ONNX Runtime CUDA Provider概述

1.1. 它是什么
ONNX Runtime（ORT）是一个高性能推理引擎，CUDA Provider 是它的 GPU 执行后端之一，用来把 ONNX 模型的计算图映射到 NVIDIA GPU 上执行。简单说：模型还是 ONNX，但算力来自 CUDA。它并不是“重写模型”，而是把算子（Conv、Gemm、Attention 等）交给 CUDA / cuDNN / cuBLAS 去跑。

1.2. 它解决什么问题
CPU 推理在吞吐和延迟上很快会撞天花板。CUDA Provider 的价值在于：

把计算密集型算子下放到 GPU
复用 NVIDIA 已经高度优化的数学库
在不改模型、不改业务代码的前提下获得数量级的性能提升

识别模型代码打包到容器内启动提示Error while deserializing header: HeaderTooLarge

Posted on 2026-01-28 Edited on 2026-01-29

问题

1.日志如下

File "/opt/conda/lib/python3.10/site-packages/transformers/modeling_utils.py", line 3613, in from_pretrained verificationservice | with safe_open(resolved_archive_file, framework="pt") as f:

safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge

问题本质判断
1.1 这是 safetensors 在反序列化模型文件头部时失败 的错误，而不是 CUDA、PyTorch 或 Transformers 的运行期错误
1.2 HeaderTooLarge 的含义很直白：模型文件的 safetensors 头信息异常地“大”或“损坏”，以至于解析器直接拒绝
1.3 该错误发生在 safe_open(..., framework="pt") 阶段，说明 模型尚未真正加载进内存

openSTF是什么

Posted on 2026-01-28

1. OpenSTF 是什么

1.1. OpenSTF（Smartphone Test Farm）是一套开源的 Android 真机管理与远程调试平台

1.2. 目标很纯粹：把一堆散落在机柜里的 Android 手机，变成 可共享、可观测、可自动化接入的“设备云”

1.3. 核心使用场景

redroid是什么

Posted on 2026-01-27 Edited on 2026-01-28

1. Redroid 是什么

1.1 定义
Redroid（Remote Android）是一种 基于容器的 Android 运行环境，本质上是把 Android OS 作为一个“可被远程访问、可批量调度的系统进程”，跑在 Linux Server 上，而不是传统手机或模拟器里。
它更像“Android-as-a-Service”，不是给人点屏幕用的，而是给系统、脚本、平台用的。

1.2 设计哲学
Redroid走的是一条很工程化的路线：

不做完整硬件模拟（避开 QEMU 那一套）
直接复用宿主机 Linux Kernel
用容器隔离 + Binder/ashmem 等 Android 关键机制
这让它在 密度、启动速度、自动化友好度 上碾压传统模拟器。

elrepo仓库介绍

Posted on 2026-01-26

1. 什么是ELRepo（Enterprise Linux Repository）

它是一个面向 企业级 Linux 发行版（Enterprise Linux）的第三方 RPM 软件仓库，主要用于 Red Hat Enterprise Linux（RHEL）及其衍生版如 CentOS、Scientific Linux、AlmaLinux 等系统。ELRepo 的目标是补充官方仓库，在硬件驱动和内核等方面提供额外的支持与更新，这些内容在官方仓库中往往比较保守或没有提供。

2. ELRepo 的定位与作用

在docker容器下gunicorn是线程创建在系统层面被拒绝

Posted on 2026-01-26

问题

...
 RuntimeError: can't start new thread xxx exited with code 1

Python 进程在启动日志线程时，pthread_create() 失败了

env

AliSecGuard阿里云的内核安全模块

Posted on 2026-01-22

AliSecGuard 是阿里云的 内核安全模块，本质上就是一个云厂商级的 内核防护 Agent(没法卸载)，它负责监控和保护主机，包括入侵检测、完整性校验、关键系统调用监控等。

1241.896537] AliSecGuard: module verification failed: signature and/or required key missing - tainting kernel
[1241.897094] AliSecGuard : a130d12303ad1ffdfbd0eea01d79bdedea99d53a
[ 1241.970141] AliSecGuard : a130d12303ad1ffdfbd0eea01d79bdedea99d53a
[ 3224.580869] wireguard: wg0: Could not create IPv4 socket
[ 3224.581661] A link change request failed with some changes committed already. Interface wg0 may have been left with an inconsistent configuration, please check.

WireGuard 在创建 IPv4 socket 时被内核层“拦住了”，而拦截者高度疑似是 AliSecGuard（阿里云安全内核模块）

关键特点：

GaGa's Blog

centos7卸载基于rpm安装docker

1.check

OP技术支持的含义

1.OP 技术支持的含义

Charles4.6.8安装及破解

1.安装

什么是 Charles(抓包工具)

1. 什么是 Charles**

阿里云arms在ack上启用

应用实时监控服务ARMS(Application Real-Time Monitoring Service)

开启arms

ONNX Runtime CUDA Provider概述

1. ONNX Runtime CUDA Provider概述

识别模型代码打包到容器内启动提示Error while deserializing header: HeaderTooLarge

问题

openSTF是什么

1. OpenSTF 是什么

redroid是什么

1. Redroid 是什么

elrepo仓库介绍

1. 什么是ELRepo（Enterprise Linux Repository）

2. ELRepo 的定位与作用

在docker容器下gunicorn是线程创建在系统层面被拒绝

问题

AliSecGuard阿里云的内核安全模块

关键特点：