公司描述
公司主要业务为科技成果标准化评价体系的培训和咨询等,参与制定行业标准,并且是行业国家标准的主要完成人。每年培训场次100+,涉及全国50余省市。围绕推动科技成果转化,推动新质生产力的发展,通过有效的技术手段来实现“产业侧的技术需求”与“高校侧科研成果”的精准匹配,而实现以文本为载体的需求和成果的语义表征,必然遭遇来自“一词多义”的挑战。 通过评估相关词汇之间的相似度,可以进行文本分类、模糊搜索、智能匹配、增强人机对话的理解,还能用于知识图谱构建及知识增强。随着基于内容的推荐技术的快速发展和广泛应用,内容的关键词提取和降噪消歧成为推荐性能优劣的关键因素,虽然有一些研究通过扩展短文本的词义或描述文本来增强语义,但大部分模型在做信息的加法,而很少考虑进行不相关或者弱相关信息的过滤,往往难以取得很好的性能。多义性是NLP、机器学习中常见的挑战,而中文的语义分析更为复杂。为了更加准确的语义描述,信息扩展的方式在很多方法中被采用,但由于大部分模型在做信息的加法,而很少考虑进行不相关或者弱相关信息的过滤,往往难以取得很好的性能。本文提出了一种基于互场景感知与多模态增强的表征方法,通过扩展词对中的词典、描述文本、以及图片信息,分别在各个模态下进行相似度比较,将相关性较弱的扩展信息进行基于场景化的过滤降噪,再将三种模态数据进行融合比较,在五个公开的数据集中证明了本算法的优越性。
展开查看公司详情