赞
踩
https://github.com/chqiwang/convseg,基于CNN做中文分词,提供数据和代码。
对应的论文Convolutional Neural Network with Word Embeddings for Chinese Word Segmentation IJCNLP2017.
https://github.com/Kyubyong/word_prediction ,基于CNN做词预测,提供数据和代码。
https://github.com/Steven-Hewitt/Entailment-with-Tensorflow,基于Tensorflow做文本蕴涵,提供数据和代码。
https://github.com/buriburisuri/speech-to-text-wavenet,基于DeepMind WaveNet和Tensorflow做句子级语音识别。
https://github.com/PKULCWM/PKUSUMSUM,北大万小军老师团队的自动摘要方法汇总,包含了他们大量paper的实现,支持单文档摘要、多文档摘要、topic-focused多文档摘要。
https://github.com/atpaino/deep-text-corrector,基于深度学习做文本纠错,提供数据和代码。
https://github.com/cmusphinx/g2p-seq2seq,基于网红transformer做, 提供数据和代码。
http://knowitall.cs.washington.edu/paralex/, 基于复述驱动学习的开放域问答。
https://github.com/Kyubyong/neural_chinese_transliterator,基于CNN做音汉互译。
情感分析包括的内容太多了,目前没发现比较全的。推荐两个适合练手的吧:https://nlp.stanford.edu/sentiment/,https://sentic.net/about/。
https://signall.us/, 该项目在手语识别做的非常成熟。
https://github.com/HIT-SCIR/ltp, 包括代码、模型、数据,还有详细的文档,而且效果还很好。
https://github.com/snowballstem/snowball, 实现的词干效果还不错。
https://github.com/saffsd/langid.py,语言识别比较好的开源工具。
https://github.com/OpenNMT/OpenNMT-py, 基于PyTorch的神经机器翻译,很适合练手。
https://github.com/vsuthichai/paraphraser,基于Tensorflow的句子级复述生成,适合练手。
https://github.com/ankitp94/relationship-extraction,基于核方法的关系抽取。
https://github.com/Orekhov/SentenceBreaking,很有意思。
https://github.com/liuhuanyong/ComplexEventExtraction, 中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。
https://github.com/alvations/pywsd,代码不多,方法简单,适合练手。
https://github.com/dice-group/AGDISTIS,实体消歧是很重要的,尤其对于实体融合(比如知识图谱中多源数据融合)、实体链接。
https://github.com/pln-fing-udelar/pghumor
https://github.com/AniSkywalker/SarcasmDetection,基于神经网络的讽刺检测。
https://github.com/hasibi/EntityLinkingRetrieval-ELR, 实体链接用途非常广,非常适合练手。
https://github.com/huggingface/neuralcoref,基于神经网络的指代消歧。
https://github.com/thunlp/THUTag, 用多种方法 实现了多种关键词/短语抽取和社会标签推荐。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。