首页 / 知识
关于 nlp:什么是用于释义的好的自然语言库?
2023-04-13 01:48:00

What's a good natural language library to use for paraphrasing?我正在寻找一个现有的库来总结或解释内容(我的目标是博客文章) - 有使用现有自然语言处理库的经验吗? 我对多种语言都很开放,所以我对能力更感兴趣 有一些关于 Grok 的讨论。现在作为 OpenCCG 支持,并且也将在 OpenNLP 中重新实现。 您可以在 http://openccg.sourceforge.net/ 找到 OpenCCG。我还建议在此处使用 Curran 和 Clark CCG 解析器:http://svn.ask.it.usyd.edu.au/trac/candc/wiki 基本上,对于释义,你需要做的是写一些东西,首先解析博客文章的句子,提取这些文章的语义,然后搜索词汇空间,这将组成创建相同的语义,然后选择一个与当前句子不匹配的句子。这将需要很长时间,而且可能没有多大意义。不要忘记,为了做到这一点,您将需要近乎完美的照应解析和获取话语级推理的能力。 如果您只是想制作没有机器可识别的重复内容的博客文章,您可以随时使用主题和焦点转换以及 WordNet 同义词。以前肯定有一些网站通过 AdWords 获利。 我认为他想通过自动解释该系统正在监控的博客来生成博客文章。 如果您可以合并 2 到 10 篇相似但来自不同来源的博客文章,然后自动进行解释性"真实"摘要(1 篇博客文章的大小),这将非常有趣。 它也可能对 Homeworks 非常有用。不幸的是,这并不容易做到。 我能看到的唯一方法就是能够将每个句子分解成"意义",然后随机改变句子结构和一些保留意义的单词。 这些句子意思相同:
编写一个程序将这些句子中的一个转换为其他句子并非易事,这些都是简单的句子,博客中的真实句子要复杂得多。 感谢这些链接。看起来 GROK 已经死了 - 但它可能仍然适用于我的目的。 还有2个链接:
Attempto Controlled English 是一个有趣的概念:因为它是看待问题的完全相反的方式。对于我正在尝试做的事情并不实用。 @mmattax 至于说几句话的建议——我不是要给出一个总结:否则那将是一个很好的柔道解决方案。我正在寻找实际总结的内容以用于其他评估目的。 您进入了非常遥远的 AI 类型领域。我主要使用 Attempto Controlled English(参见:http://attempto.ifi.uzh.ch/site/)在将文本转换为机器知识方面做了大量工作,它是一种自然语言(英语),完全可以计算机处理成多种语言不同的本体,例如 OWLDL。 看来我们会有点矫枉过正…… 是否有理由不只取博文的前几句话,然后在摘要中添加一个省略号? |
最新内容
相关内容
关于算法:用于2D碰撞检测的技术资源
关于算法:用于2D碰撞检测的技术资源?,关于算法:用于2D碰撞检测的技术资源?,用于,碰撞检测,2D,网页,Resources of techniques use for col关于bash:让ssh在目标计算机的后台
关于bash:让ssh在目标计算机的后台执行命令,关于bash:让ssh在目标计算机的后台执行命令,执行,脚本,这是,我想,Getting ssh to execute写得很好的开源项目(用于学习)?
写得很好的开源项目(用于学习)?,写得很好的开源项目(用于学习)?,学习,编程,开放源代码,程序,Well written open source projects (for适用于Web应用程序的MySQL与Postgr
适用于Web应用程序的MySQL与PostgreSQL,适用于Web应用程序的MySQL与PostgreSQL,应用程序,想知道,部署,更合适,MySQL vs PostgreSQL f推荐的用于标记或标记的SQL数据库
推荐的用于标记或标记的SQL数据库设计,推荐的用于标记或标记的SQL数据库设计,映射,方法,缩放,说过,Recommended SQL database design关于sql server:是否有适用于MySql
关于sql server:是否有适用于MySql的Profiler?,关于sql server:是否有适用于MySql的Profiler?,用于,图形用户界面,数据库引擎,监视,Is th关于apache:mod_rewrite规则,用于重
关于apache:mod_rewrite规则,用于重定向除一条特定路径以外的所有请求,关于apache:mod_rewrite规则,用于重定向除一条特定路径以外的所关于音频:什么是用于编辑MP3 / FLAC
关于音频:什么是用于编辑MP3 / FLAC的好的免费库?,关于音频:什么是用于编辑MP3 / FLAC的好的免费库?,音频,用于,文件分割,多个,What is a用于批量发送电子邮件的良好电子邮
用于批量发送电子邮件的良好电子邮件服务,用于批量发送电子邮件的良好电子邮件服务,电子邮件,托管,公司,发现,Good email service fo关于fileparse:用于解析二进制文件
关于fileparse:用于解析二进制文件数据并将其存储在数据库中的设计模式,关于fileparse:用于解析二进制文件数据并将其存储在数据库中关于c#:用于深度克隆的单元测试
关于c#:用于深度克隆的单元测试,关于c#:用于深度克隆的单元测试,对象,类对象,数组,方法,Unit tests for deep cloning假设我有一个复杂的打包用于Windows / Linux桌面的Jav
打包用于Windows / Linux桌面的Java应用程序,打包用于Windows / Linux桌面的Java应用程序,应用程序,桌面,Windows/Linux,我认为,Pack