天眼查APP显示,近日,上海美嘉林软件科技股份有限公司申请的“跨语言文本融合智能对齐方法与系统”专利公布。 摘要显示,本发明涉及跨语言信息处理技术领域,提供一种跨语言文本融合智能对齐方法和系统,通过多编码类型文本的预处理与标签识别,结合多语言预训练模型的深度语义特征提取及标注,解析文本语义与格式信息,构建的分层对齐模型,以Transformer为核心,通过多头注意力机制强化跨语言语义关联,并标签权重分配与条件约束实现字符级、段落级的格式协同,在多语言混合排版场景下,格式对齐准确率得到明显提升,模型对结构化信息的解析能力可延伸至文本与图像、表格的布局关系处理,使多模态融合场景下的综合对齐效率得到显著提高。保障文本与标签融合的准确性,避免乱码与标签混淆问题,实现从语义到格式、单模态到多模态、高精度跨语言文本对齐。
相关推荐:
文章版权声明:除非注明,否则均为美嘉林公布“跨语言文本融合智能对齐方法与系统”专利原创文章,转载或复制请以超链接形式并注明出处。