在科技飞速开展确当下,人工智能范畴的每一次冲破都能激发普遍存眷。2 月 6 日,字节跳动研讨团队正式宣布全新 AI 数字人模子 OmniHuman,这一新闻霎时外行业内掀起波涛。OmniHuman 是一款端到真个多模态模子,其最年夜亮点在于可能从单张照片天生真切满身静态视频,能够对恣意尺寸跟人物占比的单张图片联合一段输入的音频停止视频天生,天生的人物视频后果活泼,存在十分高的天然度。OmniHuman经由过程引入多模态前提驱动跟全前提练习战略,胜利处理了人类动画天生范畴临时存在的数据扩大跟泛化才能成绩。OmniHuman 采取基于 DiT 架构的多模态活动前提混杂练习战略,将分散模子跟 Transformer 相联合,实现高品质图像天生跟细节精准把持,还能融会文本、音频、姿态等多模态信息。这种 “全前提” 练习方法,让模子从更普遍的数据会合进修,无效处理了传统数字人模子练习信息单一、泛化才能缺乏的成绩。从利用层面来看,OmniHuman 有着宏大的潜力。对团体创作者跟 MCN 机构,它极年夜下降了内容创作门槛,能够疾速天生虚构主播、虚构偶像、虚构客服、虚构教导等各种数字人内容。跟着 OmniHuman 的宣布,2月7日,AI数字人观点股年夜幅上涨。 都城在线盘中年夜涨20.03%,逐日互动、恒银科技、若羽臣涨幅均超10%,天娱数科、软通能源等涨幅居前。