支持文字描述与参考图像双重输入,灵活控制视频内容与构图,从静态概念到动态画面一步到位。
涵盖写实、动漫、油画、3D渲染等多种视觉风格,满足影视、广告、社交内容等不同创作需求。
通过参数化设定实现镜头运动与物体轨迹的精准调控,让AI生成的每一帧都符合创作意图。
Saylo 在视频生成过程中融入了风格迁移技术,创作者可以为同一段文本内容匹配不同的视觉调性。无论是需要电影级光影质感的宣传片,还是偏向卡通表达的社交媒体短片,平台都能在保持主体结构与运动一致性的前提下,切换画面的美术风格。这种能力让一条视频素材可以复用至多个渠道,节省重新拍摄的成本。
Saylo 项目启动,创始团队开始研发基于深度学习的语音合成引擎,专注低延迟和自然度,内部代号“Vox-1”。
完成首版端到端语音克隆模型,支持中英双语,在少量样本条件下达到接近真人的音色还原度,获得早期种子用户好评。
Saylo 正式上线公测,推出 Web 端实时语音克隆工具,允许用户上传 30 秒音频即可生成个性化语音,注册用户突破 10 万。
发布 Saylo 2.0,引入情感控制与语调微调功能,支持长文本生成,同时推出移动端 App,日活用户峰值达到 50 万。
Saylo 与多家内容平台达成合作,开放 API 接口,提供商业级语音合成服务,被纳入 AI 语音赛道头部产品,累计生成语音超过 1 亿次。