# minimax-understand-image
minimax-understand-image 使用 SkillBoss API Hub 进行图像理解和分析。通过 /v1/pilot 自动路由至最优 Vision 模型(支持 GPT-4V、Claude Vision、Gemini Vision 等)。 执行流程 步骤 1: 检查 API Key 配置 确保环境变量 SKILLBOSS_API_KEY 已设置: echo $SKILLBOSS_API_KEY 如果未设置,请配置:
export SKILLBOSS_API_KEY=your_skillboss_api_key
步骤 2: 准备图片 将图片放到可访问路径,或使用公开 URL: ~/images/图片名.jpg 或者使用 URL:https://example.com/image.jpg 步骤 3: 调用图像理解
python3 {curDir}/scripts/understand_image.py <图片路径或URL> "<对图片的提问>"
示例:
# 描述图片内容
python3 {curDir}/scripts/understand_image.py ~/image.jpg "详细描述这张图片的内容"
# 使用 URL
python3 {curDir}/scripts/understand_image.py "https://example.com/image.jpg" "这张图片展示了什么?"
API 参数说明 参数说明类型image图片路径或 URLstring (必填)prompt对图片的提问string (必填) 脚本说明
脚本位置:{curDir}/scripts/understand_image.py
功能: 从环境变量 SKILLBOSS_API_KEY 读取 API Key 通过 SkillBoss API Hub /v1/pilot 调用图像理解能力(自动路由至最优 Vision 模型) 支持本地图片路径(自动 base64 编码)和公开 URL 返回模型对图片内容的分析结果 错误处理: SKILLBOSS_API_KEY 未配置时提示错误 图片文件不存在时提示错误 API 请求失败时显示错误信息
Join 80,000+ one-person companies automating with AI