Commit Graph

26 Commits

Author SHA1 Message Date
小鱼开发 e924193ead refactor: 简化脚本生成 SSE 事件流,移除 analyzing 阶段
- script_service: 删除一闪而过的 analyzing 事件,4阶段→3阶段
- start 和 generating 文案统一为"正在创作脚本..."
- 同步更新前后端类型定义和 API 文档
2026-04-26 21:07:54 +08:00
小鱼开发 43609de2f1 chore: 移除脚本生成流程的临时性能日志
- script_service: 删除流式生成各阶段的 info/debug 日志
- model_router: 删除首 chunk 延迟、provider 信息日志
- volcengine_provider: 删除 SDK request、首 chunk 耗时、流结束统计日志
- 保留: 初始化日志、降级/错误日志、API 层异常日志
- 为后续统一结构化日志规划做准备
2026-04-26 20:59:52 +08:00
小鱼开发 c8009f21d0 feat: 模型降级链 Pro → Lite
- model_router: 新增 FALLBACK_CHAIN 配置
- generate: 主模型失败时自动降级到备用模型
- generate_stream_with_progress: 支持流式降级,已输出内容后不再降级
- 降级成功/失败均有日志记录
2026-04-26 20:50:23 +08:00
小鱼开发 7c23cb3afb feat: 启用 JSON Mode 约束脚本生成输出
- script_service: 调用 model_router 时传入 response_format="json_object"
- volcengine_provider: generate 和 generate_stream_with_progress 支持 response_format 参数
- 强制模型输出合法 JSON,减少 Markdown 代码块包裹和说明文字导致的解析失败
2026-04-26 20:41:05 +08:00
小鱼开发 0138e7b01f refactor: generate_stream_with_progress 从 httpx 原始请求改为 AsyncOpenAI SDK
- 使用 self.async_client.chat.completions.create() 替代 httpx 原始 SSE
- 添加 stream_options={"include_usage": True} 获取 Token 用量
- 修复 usage 在最后一个 chunk(choices=[])时被跳过的问题
- 代码从 56 行减少到 36 行,更简洁可维护
2026-04-26 20:33:16 +08:00
小鱼开发 d0057ecc2c feat: 脚本生成流式优化 - Ark SDK 迁移至 httpx SSE + reasoning_effort 关闭思考过程
- volcengine_provider: Ark SDK 同步迭代器 → AsyncOpenAI → httpx 原始 SSE
  - generate_stream_with_progress 使用 httpx 直接请求,消除 80s+ 缓冲
  - 新增 generate_stream (AsyncOpenAI) 作为备用方案
  - enable_thinking 替换为 reasoning_effort,支持思考程度控制
- ai_models.yaml: 默认 LLM 改为 doubao-seed-2-0-pro,添加 reasoning_effort: minimal
- model_router: 透传 reasoning_effort 参数
- script_service: 4 阶段 SSE 精简 (start→analyzing→generating→complete)
- script.py: SSE 直连端点 /script/generate/stream
- 前端 ScriptCreation: 直连 SSE 端点,弃用调度器轮询模式
2026-04-26 20:17:12 +08:00
小鱼开发 e15bdaf996 fix: 素材匹配、Step流程、UI优化
- 修复 duration 解析 bug (parseInt→parseFloat),解决素材'换一个'候选池过小
- 素材匹配策略:候选池=满足时长+最近5个,严格模式排除已用素材
- Step2 下一步按钮绑定 dubbingAudioUrl 生成状态
- 修复 VoiceDubbing 生成后未同步 projectStore
- 修复 _meta.json JSON 格式错误导致分类列表空白
- Step3/Step4 视频预览区添加标题
- 压制字幕按钮固定在底部
- 选项卡按钮高度微调
2026-04-24 15:46:06 +08:00
小鱼开发 ee3d4c4658 feat: Vidu 对口型传 refPhotoUrl + 项目切换数据隔离 + 成品去重存储
- 提交 Vidu 对口型任务时,动态截取人物素材首帧上传七牛云,作为 refPhotoUrl
- 新增 Rust IPC upload_image_file、get_product_save_path
- 修复 extract_first_frame 对输入路径的安全校验过严问题(用户素材可能在任意目录)
- 修复新建/切换项目时 store 残留旧数据的问题:createNewProject 和 loadMeta 显式清空所有业务字段
- Step 6 最终合成直接输出到 products 目录,去掉二次复制
- 新增 VideoComposite 前置条件提示(缺少 coverPath/burnedVideoPath 时显示具体原因)
- 更新 materials.json 关键词映射
2026-04-24 12:56:46 +08:00
小鱼开发 285257905e feat: 视频生成页面改造、字幕冻结修复及多项前端优化
- 修复字幕切换模板后冻结的 bug:ASS.js 新实例在视频播放中创建时收不到
  play/playing 事件,RAF 循环不会启动。创建实例后手动触发 play 事件。
- VideoGeneration 页面 overhaul:卡片点击预览、左右箭头导航、换一个素材、
  动态按钮文案和占位提示。
- 修复私有音色素材预览播放 trialUrl 的问题,改为播放 sourceUrl。
- 放宽空镜素材匹配逻辑:优先满足时长,fallback 到最近时长并随机选择。
- 隐藏脚本生成页面的时长滑块。
- 修复登录页和侧边栏标题渐变 WebKit 兼容问题。
- 清理旧计划文档、测试文件和临时脚本。
- 更新 Makefile、prompts、materials.json 等配置。
2026-04-23 23:17:10 +08:00
小鱼开发 26db375a84 fix: finalVideoPath 语义修正、标签删除、字幕提示、七牛云超时
- VideoGeneration: Step 3 不再写入 finalVideoPath(半成品不应占用最终字段)
- VideoComposite: 修正 finalVideoPath 保存时机,保存 products 目录路径而非临时路径
- CoverDesign: 删除标签列表输入和渲染逻辑
- useCoverFabric: 删除 renderTagList、未使用的 Circle 导入
- SubtitleBurning: 未打轴时预览区显示遮罩提示
- qiniu_service: 全局超时 30s → 120s,修复 logger 未定义
2026-04-23 10:18:56 +08:00
小鱼开发 9b8d24b435 feat: 视频生成流程重构 - 本地拼接 + Vidu 对口型 + 空镜去重
- 后端: 空镜匹配支持 exclude_urls 去重
- 后端: materials.json 关键词映射扩充
- Rust: compose_video 参数平铺化修复 IPC 调用
- Rust: concat_videos_copy 去除音频
- Rust: 上传接口 API 地址改为 8081
- Rust: clip_video 放宽输入路径校验
- 前端: VideoGeneration 人物素材本地选择 + 保存恢复
- 前端: 空镜自动匹配 + 串行去重
- 前端: 对口型任务提交 + 字段重命名
- 前端: 分镜卡片去除点击/选中/hover 交互
- 前端: 视频预览改为成品视频
- Makefile: Docker 命令适配共享基础设施
2026-04-22 23:08:07 +08:00
小鱼开发 42a127d030 fix: Vidu TTS unauthorized 排查修复
- 修复容器重启方式,重新创建以读取新的 .env VIDU_API_KEY
- vidu_provider.py: api_key 为空时构造函数直接抛异常,避免发送 Token None
- vidu_provider.py: 请求失败时打印详细日志(url/status/headers/response)
- docker-compose.yml: 去除重复的环境变量定义
- .env.example: 补充 VIDU_API_KEY / VIDU_BASE_URL 模板
2026-04-22 20:31:35 +08:00
小鱼开发 4e06f4abe2 feat: 空镜素材配置后端化,视频生成流程重构
- 后端: 空镜素材迁移到 config/materials.json,duration从文件名_{N}s_自动解析
- 后端: 新增 POST /api/v1/materials/match 接口,后端做关键词匹配
- 前端: VideoGeneration 空镜匹配改为调用后端接口
- 前端: 人物出镜素材改为本地文件选择器直接选取,不走素材库
- 前端: 视频生成流程简化,移除Vidu对口型和七牛云上传
- Rust: 视频合成支持从随机起始时间截取人物素材片段
- Rust: 修复ffprobe参数错误(添加-show_entries format=duration)
2026-04-22 18:49:20 +08:00
小鱼开发 5154af777c fix(prompts): 修复脚本生成提示词 JSON 输出格式
问题:system prompt 中输出格式要求自相矛盾("必须包含以下两部分:一、分镜内容..." 与 "只输出纯 JSON"),导致 AI 返回 Markdown 表格而非 JSON 数组。

修复:
- 删除矛盾的"必须包含以下两部分/一、分镜内容"描述
- 明确指令:"你只允许输出一个 JSON 数组,不要有任何其他文字"
- duration 字段从 "3s" 字符串改为数字 3(后端已支持)
- 精简素材库列表为各主题强相关场景(原 140+ 通用场景易分散模型注意力)
- 统一 5 个提示词文件的输出格式规范
2026-04-22 12:05:35 +08:00
小鱼开发 87a4aca213 fix: Async Engine ScriptParams 改为 category + subcategory 2026-04-22 11:22:27 +08:00
小鱼开发 2e22d555b0 fix: list_categories 以 _meta.json 为准,不再扫描未配置的目录 2026-04-22 11:17:45 +08:00
小鱼开发 1057727fc5 refactor: 统一 system/_meta.json 管理分类;修复前端 TypeScript 报错 2026-04-22 11:10:33 +08:00
小鱼开发 13c5c18dcc feat: 脚本生成提示词改为大类-小类-随机加载体系 2026-04-22 11:01:45 +08:00
小鱼开发 3bf7e92b61 feat: 重写音频素材播放逻辑,提取独立 togglePlay + stopAudio,函数式更新防竞争 2026-04-22 09:53:21 +08:00
小鱼开发 388395659e fix: 播放/暂停按钮改用 Unicode 字符替代 SVG,避免 SVG 渲染异常导致图标消失 2026-04-22 09:44:59 +08:00
小鱼开发 3c08cccdd8 fix: Vidu 克隆 voice_id 长度校验,自动规范化用户输入名称 2026-04-22 07:32:56 +08:00
小鱼开发 4795acc367 feat: Vidu 语音能力全面接入,音频归属修正至项目级
- 后端 Voice API 全面切换至 Vidu(TTS/克隆/对口型)
- 前端配音页面 UI 优化:重新生成+播放音频双按钮
- 素材库克隆适配:Vidu 同步克隆,前端预校验格式/大小/时长
- 音频数据归属修正:生成配音保存到 meta.json(dubbingAudioUrl/Path/VoiceId)
- 不再写入 audios.json 和 segments.json,统一项目级一份配音
- Rust save_audio 支持 skip_list 参数跳过 audios.json 写入
2026-04-22 00:17:04 +08:00
小鱼开发 67e73b5a51 feat: 素材库重构、七牛上传修复、配音页面优化、MiniMax后端接入
- 素材库: VoiceMaterialLibrary 支持音频/视频分类、Modal弹窗、进度弹窗
- 列表布局: 紧凑单行、灰色图标按钮、重命名功能、删除ConfirmModal
- 生成配音: toast替换为ProgressModal
- 私有音色显示: 描述改为createdAt日期
- 七牛上传: 修复upload_stream参数、修正put_stream参数名
- MiniMax后端: 新增Provider+Service,TTS/克隆/音色列表切到MiniMax
- 前端默认音色: tianxin_xiaoling
- Rust: 新增voice命令、本地音频存储、配音生成功能
- 新增shot统计组件、脚本编辑器优化
2026-04-21 23:27:08 +08:00
小鱼开发 189fdf5ed6 feat: 接入 Vidu TTS/复刻/对口型,替换 MiniMax 语音能力
- 新增 ViduProvider: TTS同步、声音复刻、对口型、任务查询
- 新增 ViduTTSService: 业务封装,6个精选中文预设音色
- Voice API 路由全面切换至 Vidu
- 新增 /voice/lip-sync 对口型异步接口
- 前端适配: 16个音色→6个、slider范围更新、音量默认0
- 添加 vidu-tts-api.md 开发文档
- docker-compose 新增 VIDU_API_KEY 环境变量映射
2026-04-21 23:26:24 +08:00
小鱼开发 bb08d0f586 refactor: 从智影 Fork 重构为智剪,独立 Docker 基础设施,开发模式认证兜底
主要变更:
- 修复 /tasks/script 路由 404(去掉重复 prefix)
- 开发模式自动认证兜底(无需登录即可测试流程)
- Docker 基础设施独立化(共用 db/redis)
- 前端 API 端口改为 8081
- 新增 TTS/语音克隆、视频粗剪、音频混音等智剪功能
- 删除智影专属模块(avatar、model_usage、qiniu 上传等)
2026-04-21 12:35:50 +08:00
小鱼开发 74983ce5ec feat: init meijiaka-zj project from ai-meijiaka template 2026-04-20 16:39:57 +08:00