赞
踩
NLP:自然语言处理技术最强学习路线之NLP简介(岗位需求/必备技能)、早期/中期/近期应用领域(偏具体应用)、经典NLP架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装(更新中)
导读:本文章主要总结了自然语言处理技术在不同时期的代表性算法和技术,以及对应的经典案例应用,当然,也包括近期的LLMs大模型算法的理论算法讲解与部署实战案例。本文章将会永久持续更新,及时追踪和更新NLP领域的SOTA技术……
目录
Interview之NLP:人工智能领域求职岗位—自然语言处理NLP算法工程师职位的简介、薪资介绍、知识结构之详细攻略
AI:人工智能领域具体应用场景案例介绍之以领域划分(CV领域/DS领域/NLP领域/金融领域/爬虫领域)、以项目划分(AI推荐/AI推断/AI法律咨询/AI挖掘)目录来理解技术交互流程
Computer:正则表达式技术的简介(元字符/普通字符使用字典及其方法总结大全)、相关库介绍、案例应用之详细攻略
NLP:利用python编程语言的split函数结合if判断(T1自定义函数或T2封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档
Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读
NLP:《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读
AI公开课之NLP:19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟
AI公开课:19.04.03周明—MSRA副院长《NLP的进步如何改变搜索的体验》课堂笔记以及个人感悟
AI公开课之NLP:19.04.04李航—字节跳动AILab总监《深度学习与自然语言处理:评析与展望》课堂笔记以及个人感悟
AI之NLP:2020年6月21日北京智源大会演讲分享之15:15-15:40黄萱菁教授《自然语言处理中的表示学习》
AI开发者大会之语音语义技术实践与应用:2020年7月3日《NLP在教育行业的应用》、《AI防疫-语音语义技术在政务联络场景中的应用》、《智能客服机器人在售前导购场景中的应用实践》
LLMs:大力出奇迹?Bigger is better?AI下一代浪潮?预训练大语言模型的简介(起源/目的/概述/技术基础/核心/影响/优缺点/未来趋势)、发展史、模型分类及其对比、案例应用之详细攻略
AI:大模型领域最新算法SOTA总结、人工智能领域AI工具产品集合分门别类(文本类、图片类、编程类、办公类、视频类、音频类、多模态类)的简介、使用方法(持续更新)之详细攻略
AGI:人工智能大模型领域实战篇—设计一个类似GPT-3.5/GPT-4的大模型从开发→部署→应用需要经过的八大步骤、为什么只有少数公司和机构能够承担这样的训练成本之详细介绍
LLMs:预训练大模型实现全流程详解(以LLaMA为例)—收集数据→数据预处理→模型训练与评估→模型微调与推理→模型部署→实现复杂任务之详细攻略
NLP之LLMs:大型语言模型领域LLMs技术发展史、LLMs最新模型的简介、各种维度对比(模型参数/训练时间/训练成本)、在线测试网站集合之详细攻略(持续更新)
PTMs:大模型领域之SOTA(最先进模型)的相关术语知识总结(持续积累)、每个LLM开发者都应知道的数字、SOTA算法(NLP领域+CV领域)核心技术重点梳理之详细攻略
LLMs:自然语言处理领域—大语言模型的涉及四大技术领域(TL/USL/PT+Fine/Seq2Seq)、十大核心组件之详细攻略
LLMs之ChatGPT:研究探讨国内外各大AI机构在预训练大模型领域构建或复现类似ChatGPT失败原因以及ChatGPT适用和不适用任务场景的综合梳理
LLMs之ChatGPT:研究探讨国内外各大AI机构在预训练大模型领域构建或复现类似ChatGPT失败原因以及ChatGPT适用和不适用任务场景的综合梳理
2023年10月27日,LLMs之ChatGLM3:ChatGLM3/ChatGLM3-6B的简介(多阶段增强+多模态理解+AgentTuning技术)、安装、使用方法之详细攻略
2023年9月25日,LLM之Colossal-LLaMA-2:Colossal-LLaMA-2的简介、安装、使用方法之详细攻略
2023年9月20日,LLMs之InternLM:InternLM-20B的简介、安装、使用方法之详细攻略
2023年9月7日,LLMs之Falcon 180B:Falcon 180B的简介、安装、使用方法之详细攻略
2023年9月6日,LLMs之Baichuan 2:Baichuan 2的简介、安装、使用方法之详细攻略
2023年08月25日,LLMs之Code:Code Llama的简介、安装、使用方法之详细攻略
2023年07月31日,LLMs:Chinese-LLaMA-Alpaca-2的简介、安装、案例实战应用之详细攻略
2023年07月18日,LLMs之LLaMA2:LLaMA2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略
2023年07月11日,LLMs之Baichuan:Baichuan-13B模型的简介(包括Baichuan-7B)、安装、使用方法之详细攻略
2023年07月06日,LLMs之InternLM:InternLM/InternLM-7B模型的简介、安装、使用方法之详细攻略
2023年06月25日,LLMs之ChatGLM2:ChatGLM2-6B的简介、安装、使用方法之详细攻略
2023年06月20日,LLMs:《vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention》翻译与解读
2023年06月5日,LLMs:《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》翻译与解读
2023年03月29日,AIGC:ColossalChat(基于LLM和RLHF技术的类似ChatGPT的聊天机器人)/ColossalAI的简介、安装、使用方法之详细攻略
2023年3月15日,AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略
LLMs之GPT-4:基于OpenAl新增函数调用功能的简介、两种方法(原生SDK和LangChain框架)实现之详细攻略
2023年3月14日,LLMs之Alpaca:《Alpaca: A Strong, Replicable Instruction-Following Model》翻译与解读
2023年03月10日,LLMs之GLM-130B/ChatGLM:《GLM-130B: AN OPEN BILINGUAL PRE-TRAINED MODEL》翻译与解读
2023年2月25日,AIGC之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读
LLMs之InstructGPT:《Training language models to follow instructions with human feedback》翻译与解读
LLMs:《PaLM: Scaling Language Modeling with Pathways》翻译与解读
LLMs:《OPT: Open Pre-trained Transformer Language Models》翻译与解读
LLMs:《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》翻译与解读
Competition之ML/DL:机器学习、深度学习各种计算机视觉、自然语言处理、科学预测等等比赛竞赛简介
NLP:自然语言处理技术的简介(是什么/做什么/怎么做)、领域方向-细分任务及其评估标准、发展历史、案例应用之详细攻略
NLP:自然语言处理技术之NLP技术实践—自然语言/人类语言“计算机化”的简介、常用方法分类(基于规则/基于统计,离散式/分布式)之详细攻略
NLP:自然语言处理领域常见的文本特征表示/文本特征抽取(本质都是“数字化”)的简介、四大类方法(基于规则/基于统计,离散式【one-hot、BOW、TF-IDF】/分布式)之详细攻略
NLP:LM语言模型的简介(词嵌入模型VS语言模型VS预训练模型)、发展历史(N-Gram→RNN→Transformer)、案例应用(语音识别/机器翻译/自然语言生成)之详细攻略
NLP:自然语言处理领域技术的发展史—多种维度分类—四个阶段/四大思想/四大范式/四大方法论(规则→统计→深度学习→大模型)之详细攻略
NLP:自然语言处理领域技术的发展史—有监督模型没落、无监督模型兴起(两代PTM+词向量发展史+预训练语言模型/自监督学习)、神经网络算法对比(BP/W2C/PTM)的兴起之详细攻略
NLP:自然语言处理领域技术的发展史—PTM预训练大模型(LLMs+多模态)的简介(2017~2022年大模型领域各个算法的诞生时间/参数量/机构/功能/特点,图表形式)之详细攻略
LLMs:大力出奇迹?Bigger is better?AI下一代浪潮?预训练大语言模型的简介(起源/目的/概述/技术基础/核心/影响/优缺点/未来趋势)、发展史、模型分类及其对比、案例应用之详细攻略
LLMs:自然语言处理领域—大语言模型的涉及四大技术领域(TL/USL/PT+Fine/Seq2Seq)、十大核心组件之详细攻略
NLP之PTM:自然语言处理领域—预训练大模型时代各种吊炸天算法概述(NNLM→Word2Vec→ELMO→Attention→Transformer→GPT/BERT系列)、关系梳理、模型对比之详细
NLP之LLMs:基于Transformer的三类基础架构及其代表性算法(BERT/RoBERTa/ALBERT/T5、GPT系列、XLNet/T-NLG)之详细攻略
Paper:大模型之《Pre-Trained Models: Past, Present and Future大规模预训练模型的发展历史、最新现状和未来发展三个方向》翻译与解读
Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读
NLP:《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读
NLP:LSTM之父眼中的深度学习十年简史《The 2010s: Our Decade of Deep Learning / Outlook on the 2020s》的参考文献
NLP:自然语言处理技术之词语级别相关术语解释(如上位词/WordNet)、基于词汇层面的词法分析六大任务(分词/词性标注/词干提取-词形还原/新词发现/形态分析/拼写校正)的简介及其应用
NLP之NLTK:利用nltk对文本数据语料库实现数据预处理(断句+分词+去除停用词+词性标注+文本标准化【词干提取+词形还原】)案例应用
NLP之NLTK:利用nltk对文本数据语料库实现将句子中的词组分为不同的语义单元三种方法(Chunk组块分析/NER命名实体识别/短语结构分析)的应用案例
NLP之NLTK:利用NLTK的WordNet模块来查询某单词的同义词集合并获取其定义/例句/上位词进而深入理解单词的含义和关联性应用案例
NLP之TFTS读入数据:TF之TFTS读入时间序列数据的几种方法
NLP之nltk:基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现
NLP:对文本进行预处理操作(分词+合并+去掉标点符号和空格+去重+词性标注并转为字典、特征编码并存为字典、标签编码并存为字典)实现实际样本特征编码、实际样本标签编码应用案例
NLP:利用re模块对字符串数据实现多个关键词模糊匹配,模糊匹配测试数据并统计个数输出字典
NLP:利用re和collections模块进行词频统计之关键词匹配并统计个数以字典形式输出,利用正则表达式findall、split、match函数对字符串组成的列表数据,进行关键词定位匹配并统计输
NLP:对字符串按照一个、多个自定义分隔符进行分割、将列表转为字符串同时自定义连接符
NLP:以周杰伦的《Mojito》歌词为例字符串切分之清除一段由列表组成的字符串文本中的所有杂乱符号
NLP之WordCloud:基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图,看看那时我们的爱情)
NLP之gensim:基于fetch_20newsgroups数据集利用word2vec算法进行词向量训练并推理(输出指定单词最相关的10个词汇)
NLP之word2vec:利用 Wikipedia Text(中文维基百科)语料+Word2vec工具来训练简体中文词向量
NLP之TF之LSTM:基于Tensorflow框架采用PTB数据集建立LSTM网络的自然语言建模
NLP:自然语言处理常用任务简介、GLUE基准(通用语言理解评估,四类九个)和SuperGLUE基准的简介、任务分类、使用方法之详细攻略
NLP:自然语言技术领域相关任务分类—七大任务(表示→提取→匹配→分类→聚类→生成→问答)、两大层次(五种顶层+四种底层)、LLMs四大类(无监督预训练/有监督微调/RL微调/多模态增强)之详细攻略
NLP:自然语言技术领域相关任务分类—七大任务(表示→提取→匹配→分类→聚类→生成→问答)、两大层次(五种顶层+四种底层)、LLMs四大类(无监督预训练/有监督微调/RL微调/多模态增强)之详细攻略
NLP:利用预训练语言模型实现四种底层基本任务—词法分析(词向量)、语义分析(语义解析)、信息抽取(命名实体识别NER)应用案例
NLP:基于textrank4zh库对文本实现提取文本关键词、文本关键短语和文本摘要
NLP:基于snownlp库对文本实现提取文本关键词和文本摘要
NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary)
NLP之TM:基于gensim库调用20newsgr学习doc-topic分布并保存为train-svm-lda.txt、test-svm-lda.txt
NLP之TM之Dirichlet:朴素贝叶斯NB的先验概率之Dirichlet分布的应用
NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类
NLP之TM:基于多个文本数据(jieba分词+Dictionary构建字典+BoW转词频向量)利用LDA模型(gensim)实现主题模型进而转为结构化数据应用案例
NLP之TM:基于多个文本数据(CountVectorizer转词频向量)利用LDA模型(sklearn)实现主题模型进而转为结构化数据应用案例
NLP之TM:基于多个文本数据(TfidfVectorizer向量化)利用NMF模型(sklearn)实现主题模型进而转为结构化数据应用案例
NLP之TM:基于多个文本数据(BertTokenizer)利用BERT预训练模型(transformers)结合K-means均值聚类算法对文本向量进行聚类实现主题模型进而转为结构化数据应用案例
NLP:文档结构化(将大量的自然语言文本数据转化为结构化数据)的简介(LDA对比NMF等)、常用四大方法(依存分析/命名实体识别/主题模型/结构化序列标记)、案例应用之详细攻略
NLP之NB:基于sklearn库利用不同语种数据集训练NB(朴素贝叶斯)算法,对新语种进行语种检测
NLP之TEA之CNN:利用CNN算法实现对句子分类+进行情感分析(预测句子情感)
NLP之TEA:自然语言处理之文本情感分析的简介、算法、应用、实现流程方法、案例应用之详细攻略
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码
NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→拼音&简繁转换→情感分析→测试)
NLP之TEA之NB/LoR:基于NB和LoR算法对Kaggle IMDB影评数据集(国外类似豆瓣电影)情感分析进行分类
NLP之TEA之NB/LoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+TfidfVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测
NLP之TEA之NB/LoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+CountVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测
NLP之TEA之NB/GBT:基于朴素贝叶斯(count/tfidf+网格搜索+4fCrva)、梯度提升树(w2c+网格搜索+4fCrva)算法对IMDB影评数据集进行文本情感分析(情感二分类预测)
NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略
NLP之ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略
NLP之ASR:基于python和机器学习算法带你玩转的语音实时识别技术
NLP:自然语言处理领域——文本生成任务之基于规则预定义填充模板和填充词汇列表通过随机选择词汇填入模板中实现文本生成任务
LLMs之BERT:基于s框架利用预训练Transformer(如BERT)进行多任务学习(添加自定义任务—文本情感分类)训练并进行模型打包和模型推理应用案例实现代码
LLMs之BERT:基于s框架利用预训练Transformer进行多任务学习(自定义任务—文本情感分类和命名实体识别NER)训练并进行模型打包和模型推理应用案例实现代码
LLMS之GPT-2:基于大型语料数据集(分词和编码)并进行数据预处理利用GPT-2模型实现模型训练调优应用案例实现代码
LLMS之GPT-3:基于大型语料数据集(分词和编码)并进行数据预处理利用GPT-3模型实现模型训练调优应用案例实现代码
LLMs:从头到尾手把手教大家利用ChatGLM-6B模型实现训练、部署、推理(CLI/GUI)、微调(两个提效技巧+三种微调方法)图文教程之详细攻略
LLMs:在单机CPU+Windows系统上实LLaMA模型(基于facebookresearch的GitHub)进行模型部署且实现模型推理全流程步骤的图文教程(非常详细)
LLMs:在单机CPU+Windows系统上实现中文LLaMA算法(基于Chinese-LLaMA-Alpaca)进行模型部署且实现模型推理全流程步骤的图文教程(非常详细)
LLMs:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型部署且实现模型推理全流程步骤的图文教程(非常详细)
LLMs:基于Langchain框架利用ChatGLM大模型接入本地知识库实现问答响应项目图文教程之详细攻略
LLMs:LLMs场景实战案例应用之基于自然语言交互+SQL查询+Algorithm(构建高效数据库+快速缩小搜索范围→解决高维+高效查找)查找的内部数据搜索和问答应用案例的简介、具体实现之详细攻略
NLP:自然语言处理常用任务简介、GLUE基准(通用语言理解评估,四类九个)和SuperGLUE基准的简介、任务分类、使用方法之详细攻略
NLP之WE之CBOW&Skip-Gram:CBOW&Skip-Gram算法概念相关论文、原理配图、关键步骤之详细攻略
NLP之WE之Skip-Gram:基于TF利用Skip-Gram模型实现词嵌入并进行可视化、过程全记录
NLP:Word Embedding词嵌入/word2vec词向量思想方法(一种主流的分布式表示)的简介、使用方法、案例应用之详细攻略
NLP之ELMo:ELMo模型的简介(解决一词多义的思路)、结构(预训练过程、如何使用ELMo的编码值、推理过程)之详细攻略
DL之Transformer:Transformer的简介(优缺点/架构详解,基于Transformer的系列架构对比分析)、使用方法(NLP领域/CV领域)、案例应用之详细攻略
NLP之GPT-1/GPT-2:GPT-1的概述(简介、原理、意义、结构、创新点、优缺点、数据集)、为何单向Transfo、模型结构、训练过程,GPT-2的概述(大数据、大模型、灵感点)之详细攻略
NLP之BERT:BERT的简介(背景、改进点、创新点、简介、意义、原理、优缺点、总结与评价)、模型结构、训练过程(MLM、NSP任务的概述)之详细攻略
NLP:NLP领域没有最强,只有更强的模型——GPT-3的简介、安装、使用方法之详细攻略
NLP之PLUG:阿里达摩院发布最大中文预训练语言模型PLUG的简介、架构组成、模型训练、使用方法之详细攻略
AI之DS/CV/NLP:Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介、案例应用之详细攻略
Py之word2vec:word2vec的简介、安装、案例应用之详细攻略
Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略
Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略
Py之gensim:gensim的简介、安装、使用方法之详细攻略
Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略
Py之thulac:THULAC的简介、安装、使用方法之详细攻略
NLP之ltp:LTP(一款中文自然语言处理工具)的简介、安装、使用方法(分词/词性标注/命名实体识别/依存句法分析/语义角色标注)之详细攻略
Py之textrank4zh:textrank4zh的简介、安装、使用方法之详细攻略
Py之spacy:spacy/spacy-transformers 的简介、安装、使用方法之详细攻略
Py之transformers:transformers的简介、安装、使用方法、案例应用之详细攻略
NLP之ModelScope:基于ModelScope框架的afqmc数据集利用StructBERT预训练模型的文本相似度算法实现文本分类任务图文教程之详细攻略
DL之IDE:深度学习环境安装之计算机视觉开发环境搭建的详细流程(Ubuntu16.04+cuda9.0+cuDNN7.4.2+tensorflow_gpu)
DL之IDE:深度学习环境安装之Visual Studio 2015版本+CUDA8.0+Cudnn8.0+OpenCV 3.1.0版本完美搭配安装图文教程之详细攻略
DL之IDE:深度学习环境安装之Tensorflow/tensorflow_gpu+Cuda+Cudnn(最清楚/最快捷)之详细攻略(图文教程)
DL之IDE:深度学习环境安装之CUDA的简介(显卡GPU/驱动/CUDA间的关系)、安装(根据本地电脑的NVIDIA显卡驱动版本去正确匹配CUDA版本)之详细攻略
DL之IDE:深度学习环境安装之NVIDIA驱动程序安装图文教程(根据Anaconda的CUDA版本去安装对应匹配的NVIDIA)之详细攻略
TensorFlow:深度学习框架TensorFlow/TensorFlow_GPU的简介、安装、测试之详细攻略
LLMs:预训练大模型六大步骤实现全流程详解(以LLaMA为例)—收集数据→数据预处理→模型训练与评估→模型微调与推理→模型部署→实现复杂任务之详细攻略
7.2.1、部署ChatGLM-6B:混合精度+ZeRO+fine-tuning/P-tuning v2/LoRA
LLMs:从头到尾手把手教大家利用ChatGLM-6B模型实现训练、部署、推理(CLI/GUI)、微调(两个提效技巧+三种微调方法)图文教程之详细攻略
LLMs:基于Langchain框架利用ChatGLM大模型接入本地知识库实现问答响应项目图文教程之详细攻略
7.2.2、部署中文版LLaMA系列/Alpaca系列——Chinese-LLaMA-Alpaca、Chinese-Alpaca-LoRA-7b:合并权重+LoRA技巧+指令微调
LLMs:在单机CPU+Windows系统上实LLaMA模型(基于facebookresearch的GitHub)进行模型部署且实现模型推理全流程步骤的图文教程(非常详细)
LLMs:在单机CPU+Windows系统上实现中文LLaMA算法(基于Chinese-LLaMA-Alpaca)进行模型部署且实现模型推理全流程步骤的图文教程(非常详细)
7.2.3、部署原始LLaMA系列/Alpaca系列——多卡并行+LoRA技巧、多卡并行+QLoRA技巧
LLMs之LLaMA2:基于LocalGPT利用LLaMA2模型实现本地化的知识库(Chroma)并与本地文档(基于langchain生成嵌入)进行对话问答图文教程+代码详解之详细攻略
Dataset:数据集集合(NLP方向数据集)——常见的自然语言处理数据集大集合(建议收藏,持续更新)
LLMS之GPT-2:基于大型语料数据集(分词和编码)并进行数据预处理利用GPT-2模型实现模型训练调优应用案例实现代码
LLMS之GPT-3:基于大型语料数据集(分词和编码)并进行数据预处理利用GPT-3模型实现模型训练调优应用案例实现代码
Interview之NLP:人工智能领域求职岗位—自然语言处理NLP算法工程师职位的简介、薪资介绍、知识结构之详细攻略_自然语言处理工程师项目简介_一个处女座的程序猿的博客-CSDN博客
基本概念 | SOTA:state-of-the-art,目前最好、最先进、最优的模型; |
专业概念 | token(符号):包括单词和标点。给定句子,如何用一串数字来表示它; Sentence Order Prediction,SOP语序预测任务; Next Sentence Prediction,NSP判断两句话是否有顺序关系; |
CBOW:Continuous Bag-Of-Words Model; PTMs:Pre-trained Models,预训练模型; |
Computer:正则表达式技术的简介(元字符/普通字符使用字典及其方法总结大全)、相关库介绍、案例应用之详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP:利用python编程语言的split函数结合if判断(T1自定义函数或T2封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档_一个处女座的程序猿的博客-CSDN博客
NLP:《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读_一个处女座的程序猿的博客-CSDN博客
AI公开课之NLP:19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟_一个处女座的程序猿的博客-CSDN博客
AI公开课:19.04.03周明—MSRA副院长《NLP的进步如何改变搜索的体验》课堂笔记以及个人感悟_一个处女座的程序猿的博客-CSDN博客
AI公开课之NLP:19.04.04李航—字节跳动AILab总监《深度学习与自然语言处理:评析与展望》课堂笔记以及个人感悟_ai李航简介jiaocai_一个处女座的程序猿的博客-CSDN博客
AI之NLP:2020年6月21日北京智源大会演讲分享之15:15-15:40黄萱菁教授《自然语言处理中的表示学习》_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/122301072
https://yunyaniu.blog.csdn.net/article/details/130204199
https://yunyaniu.blog.csdn.net/article/details/131332074
https://yunyaniu.blog.csdn.net/article/details/130863144
https://yunyaniu.blog.csdn.net/article/details/130876779
LLMs:自然语言处理领域—大语言模型的涉及四大技术领域(TL/USL/PT+Fine/Seq2Seq)、十大核心组件之详细攻略_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131155739
https://yunyaniu.blog.csdn.net/article/details/130877379
https://yunyaniu.blog.csdn.net/article/details/131155739
https://yunyaniu.blog.csdn.net/article/details/131098969
LLMs之ChatGLM3:ChatGLM3/ChatGLM3-6B的简介(多阶段增强+多模态理解+AgentTuning技术)、安装、使用方法之详细攻略-CSDN博客
LLM之Colossal-LLaMA-2:Colossal-LLaMA-2的简介、安装、使用方法之详细攻略-CSDN博客
LLMs之InternLM:InternLM-20B的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之Falcon 180B:Falcon 180B的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之Baichuan 2:Baichuan 2的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之Code:Code Llama的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs:Chinese-LLaMA-Alpaca-2的简介、安装、案例实战应用之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之LLaMA2:LLaMA2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之Baichuan:Baichuan-13B模型的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之InternLM:InternLM/InternLM-7B模型的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs之ChatGLM2:ChatGLM2-6B的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
LLMs:《vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention》翻译与解读_一个处女座的程序猿的博客-CSDN博客
LLMs:《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》翻译与解读_一个处女座的程序猿的博客-CSDN博客
LLMs:《Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca》翻译与解读_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/130537064
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131326060
https://yunyaniu.blog.csdn.net/article/details/129775107
LLMs之GLM-130B/ChatGLM:《GLM-130B: AN OPEN BILINGUAL PRE-TRAINED MODEL》翻译与解读_一个处女座的程序猿的博客-CSDN博客
AIGC之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读_ai自然语言处理_一个处女座的程序猿的博客-CSDN博客
下边四篇论文分别从微调、模型结构、多语言模型以及模型规模等角度,探索了提高语言模型性能和泛化能力的不同方法。它们以开源的形式发布强大的语言模型,为NLP研究和应用提供了有力工具。
ML:文本、图像等数值化数据相似度计算之余弦相似度计算三种python代码实现_如何把 信息转换为余弦相似度数据_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/125476444
LLMs:《OPT: Open Pre-trained Transformer Language Models》翻译与解读_csv数据集下载_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/128509792
AI:人工智能的多模态融合模型的简介、发展以及未来趋势_一个处女座的程序猿的博客-CSDN博客
DataScience:数据处理技术之针对时间序列数据衍变—构造时间滑动窗口数据的简介、代码实现、案例应用之详细攻略_时间序列滑动构造_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/79130306
NLP:自然语言处理技术之NLP技术实践—自然语言/人类语言“计算机化”的简介、常用方法分类(基于规则/基于统计,离散式/分布式)之详细攻略_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/128877833
https://yunyaniu.blog.csdn.net/article/details/125476258
https://yunyaniu.blog.csdn.net/article/details/125476329
https://yunyaniu.blog.csdn.net/article/details/131198941
https://yunyaniu.blog.csdn.net/article/details/122301072
LLMs:自然语言处理领域—大语言模型的涉及四大技术领域(TL/USL/PT+Fine/Seq2Seq)、十大核心组件之详细攻略_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131098969
NLP:《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131118547
https://yunyaniu.blog.csdn.net/article/details/131118669
https://yunyaniu.blog.csdn.net/article/details/131118767
更新中……
NLP之TFTS读入数据:TF之TFTS读入时间序列数据的几种方法_tf读写时序_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/128877833
NLP之nltk:基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现_nltk句子分割_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131255407
https://yunyaniu.blog.csdn.net/article/details/114991842
https://yunyaniu.blog.csdn.net/article/details/115005872
NLP:对字符串按照一个、多个自定义分隔符进行分割、将列表转为字符串同时自定义连接符_一个处女座的程序猿的博客-CSDN博客
NLP:以周杰伦的《Mojito》歌词为例字符串切分之清除一段由列表组成的字符串文本中的所有杂乱符号_一个处女座的程序猿的博客-CSDN博客
NLP之gensim:基于fetch_20newsgroups数据集利用word2vec算法进行词向量训练并推理(输出指定单词最相关的10个词汇)_一个处女座的程序猿的博客-CSDN博客
NLP之word2vec:利用 Wikipedia Text(中文维基百科)语料+Word2vec工具来训练简体中文词向量_一个处女座的程序猿的博客-CSDN博客
NLP之TF之LSTM:基于Tensorflow框架采用PTB数据集建立LSTM网络的自然语言建模_一个处女座的程序猿的博客-CSDN博客
NLP:自然语言处理常用任务简介、GLUE基准(通用语言理解评估,四类九个)和SuperGLUE基准的简介、任务分类、使用方法之详细攻略_glue nlp_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131039768
https://yunyaniu.blog.csdn.net/article/details/131039768
https://yunyaniu.blog.csdn.net/article/details/131137433
https://yunyaniu.blog.csdn.net/article/details/131139397
NLP:基于textrank4zh库对文本实现提取文本关键词、文本关键短语和文本摘要_textrank4keyword_一个处女座的程序猿的博客-CSDN博客
NLP:基于snownlp库对文本实现提取文本关键词和文本摘要_一个处女座的程序猿的博客-CSDN博客
NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary)_一个处女座的程序猿的博客-CSDN博客
NLP之TM之Dirichlet:朴素贝叶斯NB的先验概率之Dirichlet分布的应用_一个处女座的程序猿的博客-CSDN博客
NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类_希拉里邮件lda京东数据集_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131105951
https://yunyaniu.blog.csdn.net/article/details/131137564
https://yunyaniu.blog.csdn.net/article/details/131137572
https://yunyaniu.blog.csdn.net/article/details/131137563
NLP之NB:基于sklearn库利用不同语种数据集训练NB(朴素贝叶斯)算法,对新语种进行语种检测_nb library in sklearn_一个处女座的程序猿的博客-CSDN博客
NLP之TEA之CNN:利用CNN算法实现对句子分类+进行情感分析(预测句子情感)_一个处女座的程序猿的博客-CSDN博客
NLP之TEA:自然语言处理之文本情感分析的简介、算法、应用、实现流程方法、案例应用之详细攻略_nlp tea_一个处女座的程序猿的博客-CSDN博客
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码_nlp情感分析代码_一个处女座的程序猿的博客-CSDN博客
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)_python 中文情感分析库_一个处女座的程序猿的博客-CSDN博客
NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→拼音&简繁转换→情感分析→测试)_在网页中输入文字并进行情感分析_一个处女座的程序猿的博客-CSDN博客
NLP之TEA之NB/LoR:基于NB和LoR算法对Kaggle IMDB影评数据集(国外类似豆瓣电影)情感分析进行分类_一个处女座的程序猿的博客-CSDN博客
NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP之ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP之ASR:基于python和机器学习算法带你玩转的语音实时识别技术_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131160563
https://yunyaniu.blog.csdn.net/article/details/131160611
https://yunyaniu.blog.csdn.net/article/details/131160647
https://yunyaniu.blog.csdn.net/article/details/131118849
https://yunyaniu.blog.csdn.net/article/details/131118859
https://yunyaniu.blog.csdn.net/article/details/120249551
https://yunyaniu.blog.csdn.net/article/details/130979622
https://yunyaniu.blog.csdn.net/article/details/131016046
https://yunyaniu.blog.csdn.net/article/details/131319010
https://yunyaniu.blog.csdn.net/article/details/131016620
https://yunyaniu.blog.csdn.net/article/details/130998758
https://yunyaniu.blog.csdn.net/article/details/131506163
一个处女座的程序猿的博客_CSDN博客-Computer knowledge,ML,DL/R领域博主
NLP:自然语言处理常用任务简介、GLUE基准(通用语言理解评估,四类九个)和SuperGLUE基准的简介、任务分类、使用方法之详细攻略_glue nlp_一个处女座的程序猿的博客-CSDN博客
NLP之WE之CBOW&Skip-Gram:CBOW&Skip-Gram算法概念相关论文、原理配图、关键步骤之详细攻略_cbow论文_一个处女座的程序猿的博客-CSDN博客
NLP之WE之Skip-Gram:基于TF利用Skip-Gram模型实现词嵌入并进行可视化、过程全记录_一个处女座的程序猿的博客-CSDN博客
NLP:Word Embedding词嵌入/word2vec词向量思想方法(一种主流的分布式表示)的简介、使用方法、案例应用之详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP之ELMo:ELMo模型的简介(解决一词多义的思路)、结构(预训练过程、如何使用ELMo的编码值、推理过程)之详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP之BERT:BERT的简介(背景、改进点、创新点、简介、意义、原理、优缺点、总结与评价)、模型结构、训练过程(MLM、NSP任务的概述)之详细攻略_一个处女座的程序猿的博客-CSDN博客
NLP之PLUG:阿里达摩院发布最大中文预训练语言模型PLUG的简介、架构组成、模型训练、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
N-gram工具:http://www.speech.cs.cmu.edu/SLM/toolkit.html
RNN工具:CUED-RNNLM Toolkit
SRILM工具:http://www.speech.sri.com/projects/srilm/
Py之word2vec:word2vec的简介、安装、案例应用之详细攻略_word2vec安装_一个处女座的程序猿的博客-CSDN博客
Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略_jieba 很大吗_一个处女座的程序猿的博客-CSDN博客
Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略_一个处女座的程序猿的博客-CSDN博客
Py之gensim:gensim的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略_snownlp 安装_一个处女座的程序猿的博客-CSDN博客
【精选】Py之thulac:THULAC的简介、安装、使用方法之详细攻略-CSDN博客
NLP之ltp:LTP(一款中文自然语言处理工具)的简介、安装、使用方法(分词/词性标注/命名实体识别/依存句法分析/语义角色标注)之详细攻略-CSDN博客
Py之textrank4zh:textrank4zh的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
Py之spacy:spacy/spacy-transformers 的简介、安装、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
Py之transformers:transformers的简介、安装、使用方法、案例应用之详细攻略_transformers 安装_一个处女座的程序猿的博客-CSDN博客
NLP之ModelScope:基于ModelScope框架的afqmc数据集利用StructBERT预训练模型的文本相似度算法实现文本分类任务图文教程之详细攻略_一个处女座的程序猿的博客-CSDN博客
更新中……
https://yunyaniu.blog.csdn.net/article/details/79117569
DL之IDE:深度学习环境安装之NVIDIA驱动程序安装图文教程(根据Anaconda的CUDA版本去安装对应匹配的NVIDIA)之详细攻略_一个处女座的程序猿的博客-CSDN博客
TensorFlow:深度学习框架TensorFlow/TensorFlow_GPU的简介、安装、测试之详细攻略_tensorflow-gpu介绍_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131332074
https://yunyaniu.blog.csdn.net/article/details/120249551
https://yunyaniu.blog.csdn.net/article/details/130998758
https://yunyaniu.blog.csdn.net/article/details/130979622
https://yunyaniu.blog.csdn.net/article/details/131016046
https://yunyaniu.blog.csdn.net/article/details/131319010
https://yunyaniu.blog.csdn.net/article/details/131526319
https://yunyaniu.blog.csdn.net/article/details/131526139
https://yunyaniu.blog.csdn.net/article/details/131016620
更新中……
Dataset:数据集集合(NLP方向数据集)——常见的自然语言处理数据集大集合(建议收藏,持续更新)_自然语言学习数据集_一个处女座的程序猿的博客-CSDN博客
https://yunyaniu.blog.csdn.net/article/details/131118849
https://yunyaniu.blog.csdn.net/article/details/131118859
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。