基于解耦再融合控制的故事分镜生成方法

导航：龙图腾网> 最新专利技术> 基于解耦再融合控制的故事分镜生成方法

申请/专利权人：电子科技大学

申请日：2024-04-19

公开（公告）日：2024-06-28

公开（公告）号：CN118262003A

主分类号：G06T11/00

分类号：G06T11/00;G06F40/289;G06F40/253;G06F40/166;G06T7/194

优先权：

专利状态码：在审-公开

法律状态：2024.06.28#公开

摘要：本发明公开了一种基于解耦再融合控制的故事分镜生成方法，首先对故事文本进行处理，得到角色和场景的文字提示，根据角色和场景的预设参考图像对预训练好的稳定扩散模型进行微调，得到每个场景或角色所对应的模型参数和对应的嵌入向量，然后生成每个句子中的角色图像和场景图像，以及角色中间图像和场景中间图像，从角色图像中提取出前景掩码图像并据此将角色和场景中间图像进行融合得到融合图像，然后采用角色和场景所对应稳定扩散模型的参数对后续去噪过程进行协同控制，将最终生成图像作为句子所对应的故事分镜图像。本发明综合考虑角色的视觉一致性和场景的上下文相关性，从而提升所生成分镜图像之间的逻辑连贯性。

主权项：1.一种基于解耦再融合控制的故事分镜生成方法，其特征在于，包括以下步骤：S1：对故事文本进行处理，具体步骤包括：S1.1：将故事文本进行断句处理，得到N个离散的句子Tn，n＝1,2,…,N；S1.2：使用大语言模型根据上下文关系确定每个句子的主语、谓语、宾语和地点状语，根据地点状语确定每个句子对应的场景，如果某个句子不存在地点状语，则设置其场景为上文中最近的一个场景，然后在每个句子中添加场景标记根据主语或宾语确定场景对应的角色，在每个句子中添加角色标记k＝1,2,…,Kn，Kn表示句子Tn中的角色数量；S1.3：根据步骤S1.2的词语标记结果，对每个句子Tn进行重写，得到重写后的句子重写方法为：对于句子Tn中的每个角色，采用大语言模型从句子Tn中提取出以该角色为主语的、由主谓宾构成的叙述内容，并连同对应的角色标记一起构成内容部分将句子对应的场景以及场景标记构成场景部分同时，通过去除内容部分和场景部分中的标记，得到内容提示Tn,C,k和场景提示Tn,S；S2：对于步骤S1中确定的所有场景和角色，分别为每个场景和每个角色设置若干张参考图像；S3：对于每个角色和场景，采用对应的参考图像分别对预训练好的稳定扩散模型进行微调，得到每个场景或角色所对应的模型参数和对应的嵌入向量；S4：对于每个句子中的角色和场景，将稳定扩散模型采用对应的参数进行设置，然后以对应的内容部分或场景部分作为文字提示生成对应的角色图像和场景图像同时提取出稳定扩散模型中去噪网络在图像生成过程时间步为τ时的角色中间图像和场景中间图像τ的值根据实际需要设置；S5：对每个句子对应的每个角色图像进行前景分割，从中提取出前景掩码图像mn,C,k；然后采用如下公式对句子中的角色和场景中间图像进行整合，得到整合图像其中，⊙表示对应元素相乘；S6：对于稳定扩散模型中时间步为τ-1至0的去噪过程，每个去噪过程中的参数设置为K个角色和场景所对应的稳定扩散模型中其中一个模型中对应去噪过程的参数，该去噪过程所采用的Tokenembeddings矩阵由稳定扩散模型中的CLIPText文本编码器根据文字提示生成，其中文字提示采用如下方法确定：如果该去噪过程采用的是句子Tn中第k*个对象所对应稳定扩散模型的参数，则令文字提示为如果该去噪过程采用的是句子Tn中场景所对应稳定扩散模型的参数，则令文字提示为然后将融合图像作为稳定扩散模型时间步为τ-1的去噪过程的输入，根据所设置的参数和Tokenembeddings矩阵继续执行时间步为τ-1至0的去噪过程，将得到的最终生成图像作为句子Tn所对应的故事分镜图像。

全文数据：

权利要求：

百度查询：电子科技大学基于解耦再融合控制的故事分镜生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种安装工具

下一篇：一种纸箱印刷机用送料装置

相关技术

一种安装工具

一种纸箱印刷机用送料装置

一种纸尿裤生产用包边机

气动搬运平台

一种公共卫生用预防传染病喷雾装置

一种用于光伏发电装置的R型回转减速机

一种机罩

一种砂浆压实装置

一种配电网规划用的智慧配电网架

一种用于3C零件组装的点胶设备

一种水利施工用混凝土搅拌装置

一种巡检方便的电容补偿柜

控制相关技术

LED控制方法及控制终端_漳州立达信光电子科技有限公司_202410396483.5

通知控制方法以及通知控制装置_丰田自动车株式会社_202311799364.6

显示控制设备和显示控制方法_佛吉亚歌乐电子有限公司_202311717477.7

车辆及其控制方法、控制装置_长城汽车股份有限公司_202110881912.4

控制装置_丰田自动车株式会社_202311816561.4

湿度控制装置、包括其的湿度控制系统以及湿度控制方法_细美事有限公司_202311744866.9

电池制冷控制方法、控制器、电池制冷控制系统及汽车_比亚迪股份有限公司_202211682431.1

控制装置、控制方法、控制系统和计算机可读记录介质_富士胶片商业创新有限公司_201910171760.1

预约车辆控制方法、预约车辆控制装置及预约车辆控制系统_日产自动车株式会社_201880097858.0

马达控制装置、具有该控制装置的车辆及控制车辆的方法_现代自动车株式会社_201910802898.7

融合相关技术

新型融合蛋白和用于预防或治疗癌症的包含该融合蛋白的药物组合物_古德T细胞有限公司_201980028463.X

基于模糊粗糙集的数据分级融合方法_大连理工大学_202410448720.8

基于“算测融合”的导弹数字孪生建模方法_大连理工大学_202410451810.2

多视频流融合方法、电子设备、存储介质_北京大视景科技有限公司_202010922428.7

基于微光+彩色可见光融合图像的方法_北京晶品特装科技股份有限公司_202410258993.6

椎间融合器显影丝压装系统_宁波华科润生物科技有限公司_202321970013.2

一种椎板间支撑、固定、融合装置_北京大学第三医院(北京大学第三临床医学院)_201910768087.X

运行程序的融合方法及设备_青岛海尔洗衣机有限公司_202211693392.5

TGF-β受体胞外域融合分子及其用途_加拿大国家研究委员会_202410363517.0

用于融合语义要素的方法和装置_滴图(北京)科技有限公司_202211700968.6

故事相关技术

一种基于人工智能的动态图文故事生成方法_王建清_202311181322.6

故事生成方法、装置、电子设备及存储介质_麒麟合盛网络技术股份有限公司_202410405218.9

使用生成模型的对应于用户输入的故事视频生成_脸萌有限公司_202311681815.6

一种故事机_优趣乐学(天津)科技有限公司_202322838858.2

一种基于多源异构特征融合的可控故事生成方法_江南大学_202311828251.4

一种防护效果好的早教故事机_深圳市威龙兴实业有限公司_202323020986.2

计算机可读取的存储介质、故事影像呈现方法及系统_株式会社万代_202011143848.1

一种改进型故事机_哈尔滨艺能通讯科技开发有限公司_202322496893.0

儿童故事机_泰仕达电子(深圳)有限公司_202322468170.X

用户故事审核方法及装置_中国银行股份有限公司_202210744203.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于解耦再融合控制的故事分镜生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务