Commit Graph

18 Commits

Author SHA1 Message Date
小鱼开发 285257905e feat: 视频生成页面改造、字幕冻结修复及多项前端优化
- 修复字幕切换模板后冻结的 bug:ASS.js 新实例在视频播放中创建时收不到
  play/playing 事件,RAF 循环不会启动。创建实例后手动触发 play 事件。
- VideoGeneration 页面 overhaul:卡片点击预览、左右箭头导航、换一个素材、
  动态按钮文案和占位提示。
- 修复私有音色素材预览播放 trialUrl 的问题,改为播放 sourceUrl。
- 放宽空镜素材匹配逻辑:优先满足时长,fallback 到最近时长并随机选择。
- 隐藏脚本生成页面的时长滑块。
- 修复登录页和侧边栏标题渐变 WebKit 兼容问题。
- 清理旧计划文档、测试文件和临时脚本。
- 更新 Makefile、prompts、materials.json 等配置。
2026-04-23 23:17:10 +08:00
小鱼开发 26db375a84 fix: finalVideoPath 语义修正、标签删除、字幕提示、七牛云超时
- VideoGeneration: Step 3 不再写入 finalVideoPath(半成品不应占用最终字段)
- VideoComposite: 修正 finalVideoPath 保存时机,保存 products 目录路径而非临时路径
- CoverDesign: 删除标签列表输入和渲染逻辑
- useCoverFabric: 删除 renderTagList、未使用的 Circle 导入
- SubtitleBurning: 未打轴时预览区显示遮罩提示
- qiniu_service: 全局超时 30s → 120s,修复 logger 未定义
2026-04-23 10:18:56 +08:00
小鱼开发 9b8d24b435 feat: 视频生成流程重构 - 本地拼接 + Vidu 对口型 + 空镜去重
- 后端: 空镜匹配支持 exclude_urls 去重
- 后端: materials.json 关键词映射扩充
- Rust: compose_video 参数平铺化修复 IPC 调用
- Rust: concat_videos_copy 去除音频
- Rust: 上传接口 API 地址改为 8081
- Rust: clip_video 放宽输入路径校验
- 前端: VideoGeneration 人物素材本地选择 + 保存恢复
- 前端: 空镜自动匹配 + 串行去重
- 前端: 对口型任务提交 + 字段重命名
- 前端: 分镜卡片去除点击/选中/hover 交互
- 前端: 视频预览改为成品视频
- Makefile: Docker 命令适配共享基础设施
2026-04-22 23:08:07 +08:00
小鱼开发 42a127d030 fix: Vidu TTS unauthorized 排查修复
- 修复容器重启方式,重新创建以读取新的 .env VIDU_API_KEY
- vidu_provider.py: api_key 为空时构造函数直接抛异常,避免发送 Token None
- vidu_provider.py: 请求失败时打印详细日志(url/status/headers/response)
- docker-compose.yml: 去除重复的环境变量定义
- .env.example: 补充 VIDU_API_KEY / VIDU_BASE_URL 模板
2026-04-22 20:31:35 +08:00
小鱼开发 4e06f4abe2 feat: 空镜素材配置后端化,视频生成流程重构
- 后端: 空镜素材迁移到 config/materials.json,duration从文件名_{N}s_自动解析
- 后端: 新增 POST /api/v1/materials/match 接口,后端做关键词匹配
- 前端: VideoGeneration 空镜匹配改为调用后端接口
- 前端: 人物出镜素材改为本地文件选择器直接选取,不走素材库
- 前端: 视频生成流程简化,移除Vidu对口型和七牛云上传
- Rust: 视频合成支持从随机起始时间截取人物素材片段
- Rust: 修复ffprobe参数错误(添加-show_entries format=duration)
2026-04-22 18:49:20 +08:00
小鱼开发 5154af777c fix(prompts): 修复脚本生成提示词 JSON 输出格式
问题:system prompt 中输出格式要求自相矛盾("必须包含以下两部分:一、分镜内容..." 与 "只输出纯 JSON"),导致 AI 返回 Markdown 表格而非 JSON 数组。

修复:
- 删除矛盾的"必须包含以下两部分/一、分镜内容"描述
- 明确指令:"你只允许输出一个 JSON 数组,不要有任何其他文字"
- duration 字段从 "3s" 字符串改为数字 3(后端已支持)
- 精简素材库列表为各主题强相关场景(原 140+ 通用场景易分散模型注意力)
- 统一 5 个提示词文件的输出格式规范
2026-04-22 12:05:35 +08:00
小鱼开发 87a4aca213 fix: Async Engine ScriptParams 改为 category + subcategory 2026-04-22 11:22:27 +08:00
小鱼开发 2e22d555b0 fix: list_categories 以 _meta.json 为准,不再扫描未配置的目录 2026-04-22 11:17:45 +08:00
小鱼开发 1057727fc5 refactor: 统一 system/_meta.json 管理分类;修复前端 TypeScript 报错 2026-04-22 11:10:33 +08:00
小鱼开发 13c5c18dcc feat: 脚本生成提示词改为大类-小类-随机加载体系 2026-04-22 11:01:45 +08:00
小鱼开发 3bf7e92b61 feat: 重写音频素材播放逻辑,提取独立 togglePlay + stopAudio,函数式更新防竞争 2026-04-22 09:53:21 +08:00
小鱼开发 388395659e fix: 播放/暂停按钮改用 Unicode 字符替代 SVG,避免 SVG 渲染异常导致图标消失 2026-04-22 09:44:59 +08:00
小鱼开发 3c08cccdd8 fix: Vidu 克隆 voice_id 长度校验,自动规范化用户输入名称 2026-04-22 07:32:56 +08:00
小鱼开发 4795acc367 feat: Vidu 语音能力全面接入,音频归属修正至项目级
- 后端 Voice API 全面切换至 Vidu(TTS/克隆/对口型)
- 前端配音页面 UI 优化:重新生成+播放音频双按钮
- 素材库克隆适配:Vidu 同步克隆,前端预校验格式/大小/时长
- 音频数据归属修正:生成配音保存到 meta.json(dubbingAudioUrl/Path/VoiceId)
- 不再写入 audios.json 和 segments.json,统一项目级一份配音
- Rust save_audio 支持 skip_list 参数跳过 audios.json 写入
2026-04-22 00:17:04 +08:00
小鱼开发 67e73b5a51 feat: 素材库重构、七牛上传修复、配音页面优化、MiniMax后端接入
- 素材库: VoiceMaterialLibrary 支持音频/视频分类、Modal弹窗、进度弹窗
- 列表布局: 紧凑单行、灰色图标按钮、重命名功能、删除ConfirmModal
- 生成配音: toast替换为ProgressModal
- 私有音色显示: 描述改为createdAt日期
- 七牛上传: 修复upload_stream参数、修正put_stream参数名
- MiniMax后端: 新增Provider+Service,TTS/克隆/音色列表切到MiniMax
- 前端默认音色: tianxin_xiaoling
- Rust: 新增voice命令、本地音频存储、配音生成功能
- 新增shot统计组件、脚本编辑器优化
2026-04-21 23:27:08 +08:00
小鱼开发 189fdf5ed6 feat: 接入 Vidu TTS/复刻/对口型,替换 MiniMax 语音能力
- 新增 ViduProvider: TTS同步、声音复刻、对口型、任务查询
- 新增 ViduTTSService: 业务封装,6个精选中文预设音色
- Voice API 路由全面切换至 Vidu
- 新增 /voice/lip-sync 对口型异步接口
- 前端适配: 16个音色→6个、slider范围更新、音量默认0
- 添加 vidu-tts-api.md 开发文档
- docker-compose 新增 VIDU_API_KEY 环境变量映射
2026-04-21 23:26:24 +08:00
小鱼开发 bb08d0f586 refactor: 从智影 Fork 重构为智剪,独立 Docker 基础设施,开发模式认证兜底
主要变更:
- 修复 /tasks/script 路由 404(去掉重复 prefix)
- 开发模式自动认证兜底(无需登录即可测试流程)
- Docker 基础设施独立化(共用 db/redis)
- 前端 API 端口改为 8081
- 新增 TTS/语音克隆、视频粗剪、音频混音等智剪功能
- 删除智影专属模块(avatar、model_usage、qiniu 上传等)
2026-04-21 12:35:50 +08:00
小鱼开发 74983ce5ec feat: init meijiaka-zj project from ai-meijiaka template 2026-04-20 16:39:57 +08:00