Skip to content

Yi-Lyu/VisionShot-AI-Coach

Repository files navigation

Kapi Cam - AI 摄影教练

Powered by Gemini Live Made by Kapi Cam AI实验室

实时 AI 摄影指导应用,基于 Gemini Live API。通过语音和视觉分析,即时获得专业的构图、光线和角度建议。

功能特点

  • 📷 实时摄像头画面分析
  • 🎙️ 语音交互式摄影指导
  • 📐 三分法构图网格叠加
  • 💡 构图、光线、背景专业建议
  • 🎯 完美时刻快门提示
  • 🔇 麦克风静音切换

快速开始

环境要求

  • Node.js 18+
  • 现代浏览器(Chrome/Edge 推荐)
  • Gemini API Key(获取地址

本地安装

  1. 克隆项目

    git clone https://github.com/Yi-Lyu/VisionShot-AI-Coach.git
    cd VisionShot-AI-Coach
  2. 安装依赖

    npm install
  3. 配置 API Key

    cp public/config.example.json public/config.json

    编辑 public/config.json,填入你的 Gemini API Key:

    {
      "gemini": {
        "apiKey": "YOUR_GEMINI_API_KEY_HERE",
        "model": "gemini-2.5-flash-native-audio-preview-12-2025"
      }
    }
  4. 启动开发服务器

    npm run dev
  5. 访问应用

    打开浏览器访问 https://localhost:8006

    ⚠️ 注意:需要使用 HTTPS 才能访问摄像头和麦克风

生产部署

  1. 构建项目

    npm run build
  2. 预览构建结果

    npm run preview
  3. 部署到服务器

    dist 目录部署到任意静态文件服务器,确保:

    • 配置 HTTPS(必需,用于摄像头/麦克风权限)
    • config.json 放在服务器的 public 目录下

服务器部署示例

# 同步到远程服务器
rsync -avz --exclude 'node_modules' --exclude '.git' ./ user@server:/path/to/app/

# SSH 到服务器
ssh user@server

# 安装依赖并启动
cd /path/to/app
npm install
npm run dev -- --host 0.0.0.0

配置说明

所有配置项在 public/config.json 中:

配置项 说明 默认值
gemini.apiKey Gemini API 密钥 必填
gemini.model Gemini 模型名称 gemini-2.5-flash-native-audio-preview-12-2025
camera.frameRate 每秒发送帧数 1
camera.jpegQuality 图片压缩质量 0.5
camera.resolution 摄像头分辨率 1280x720
audio.inputSampleRate 麦克风采样率 16000
audio.outputSampleRate 扬声器采样率 24000
audio.voiceName AI 语音名称 Kore

技术栈

  • React 19 + TypeScript
  • Vite
  • Tailwind CSS
  • Gemini Live API (@google/genai)

注意事项

  • 🔐 API Key 安全public/config.json 已在 .gitignore 中忽略,请勿提交敏感信息
  • 🎧 使用耳机:建议使用耳机避免音频回声
  • 📱 移动端支持:支持移动端浏览器,需要 HTTPS 环境

许可证

MIT License


Kapi Cam AI实验室 出品

About

VisionShot AI Coach

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors