排序方式: 共有10条查询结果,搜索用时 0 毫秒
1
1.
基于购物网站用户搜索日志的商品词发现 总被引:1,自引:0,他引:1
商品词是电子商务领域描述商品的新词。主要介绍基于购物网站用户搜索日志的商品词发现的方法。该方法从搜索日志中提取用户查询,对查询进行分词,采用N元递增分步算法和串频统计,计算候选串的条件概率,选择候选商品词。为了降低人工审核的成本,只对产出商品词的准确率进行评价。利用该方法在手机、面霜和香水三类商品的搜索日志上进行了实验,最高准确率达到92.58%。 相似文献
2.
3.
中文电子病历命名实体标注语料库构建 总被引:1,自引:0,他引:1
针对中文电子病历命名实体语料标注空白的现状,研究了中文电子病历命名实体标注语料库的构建。参考2010年美国国家集成生物与临床信息学研究中心(1282)给出的电子病历命名实体类型及修饰类型的定义,在专业医生的指导下制定了详尽的中文电子病历标注规范;通过对大量中文电子病历的分析,提出了一套完整的中文电子病历命名实体标注方案,而且采用预标注和正式标注的方法,建立了一定规模的中文电子病历命名实体标注语料库,其标注语料的一致性达到了92%以上。该工作对中文电子病历的命名实体识别及信息抽取研究提供了可靠的数据支持,对医疗知识挖掘也有重要意义。 相似文献
4.
5.
我国是全球糖尿病患病人数最多的国家,患病人数仍在持续快速增长,糖尿病已成为我国重大公共卫生问题。该文关注的糖尿病健康管理对话系统服务于糖尿病患者,为患者解答日常生活中糖尿病相关问题,而目前缺乏用于训练对话系统模型的糖尿病相关数据。基于此,该文构建了首个标注体系完整的糖尿病健康管理中文对话数据集“Diachat”,以支持健康管理对话系统研究。Diachat收集了来自线上聊天平台糖尿病患者与医生的693段对话(Dialogue),共4 686句语料(Sentence),完成了6 594条对话动作(Dialogue act)标注。Diachat数据集采用基于对话动作的表示方式进行意图表示并定义了15个对话动作标签(Act label)。同时,Diachat定义了6个领域(Domain)涵盖语料涉及的领域,分别为:问题(Problem)、饮食(Diet)、行为(Behavior)、运动(Sport)、治疗(Treatment)、基本信息(Profile)。为了支持构建完整的对话系统,Diachat为用户端和系统端分别构造了对话状态,并为每段对话构造了对话目标。基于Diachat数据集,该课题进... 相似文献
6.
以高速加工中心用电主轴为研究对象,对其动态特性进行了仿真分析,得到其低阶频率和振型,为电主轴的稳定性研究提供了理论依据。同时,分析了转速、切削力和润滑方式等因素对电主轴温度的影响。 相似文献
7.
构建医疗对话系统可以缓和医疗资源紧缺和医疗资源分配不均的现状,在对话系统构建方面,如何结合已获取的知识生成对话语句是重要研究内容之一。Prompt指预先输入到语言模型的一组字符序列或编码,后续的推断从这里开始,从而影响整个语句的内容生成。该文先用医疗领域语料来对预训练语言模型进行精调,以学习医疗语句潜在的语义,然后设计Prompt方案将医疗实体引入对话生成模型,使生成的对话能够携带预设的知识,达到受控对话生成的目的。通过在医疗对话数据集MedDG上的实验验证,该文提出的方案能有效改善医疗对话生成的效果。 相似文献
8.
电子病历命名实体识别和实体关系抽取研究综述 总被引:2,自引:0,他引:2
电子病历(Electronic medical records,EMR)产生于临床治疗过程,其中命名实体和实体关系反映了患者健康状况,包含了大量与患者健康状况密切相关的医疗知识,因而对它们的识别和抽取是信息抽取研究在医疗领域的重要扩展. 本文首先讨论了电子病历文本的语言特点和结构特点,然后在梳理了命名实体识别和实体关系抽取研究一般思路的基础上,分析了电子病历命名实体识别、实体修饰识别和实体关系抽取研究的具体任务和对应任务的主要研究方法. 本文还介绍了相关的共享评测任务和标注语料库以及医疗领域几个重要的词典和知识库等资源. 最后对这一研究领域仍需解决的问题和未来的发展方向作了展望. 相似文献
9.
中文电子病历命名实体和实体关系语料库构建 总被引:1,自引:0,他引:1
电子病历是由医务人员撰写的面向患者个体描述医疗活动的记录,蕴含了大量的医疗知识和患者的健康信息.电子病历命名实体识别和实体关系抽取等信息抽取研究对于临床决策支持、循证医学实践和个性化医疗服务等具有重要意义,而电子病历命名实体和实体关系标注语料库的构建是首当其冲的.在调研了国内外电子病历命名实体和实体关系标注语料库构建的基础上,结合中文电子病历的特点,提出适合中文电子病历的命名实体和实体关系的标注体系,在医生的指导和参与下,制定了命名实体和实体关系的详细标注规范,构建了标注体系完整、规模较大且一致性较高的标注语料库.语料库包含病历文本992份,命名实体标注一致性达到0.922,实体关系一致性达到0.895.为中文电子病历信息抽取后续研究打下了坚实的基础. 相似文献
10.
一种ERP物料清单结构检查方法的研究 总被引:1,自引:0,他引:1
针对BOM数据在插入或修改时有可能产生循环结构的问题,进行了研究,分析了BOM数据的结构,给出了一个结构检查的算法。此算法首先建立反向搜索模型树,然后对反向搜索模型树进行分层遍历搜索。 相似文献
1