搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
天景科技苑
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
flowable工作流-过滤发起人节点表单_ruoyi-flowable-plus 审批人
2
你应该知道的21大Python量化交易工具
3
【开源数据集】电动车佩戴头盔检测数据集(TWHD)
4
Python循环结构基础-continu/break
5
图卷积神经网络(GCN)实战_图神经网络实战
6
太强了! ChatGPT能上传文件了,文档图片数据集秒理解_chatgpt3.5 上传文档
7
智能灯控(基于ZigBee)
8
让照片动起来的工具有哪些呢?用过这些真不错_让老照片动起来
9
python path configuration_Pycharm-在远程解释器中配置PYTHONPATH
10
软件崩溃时Visual Studio中看不到有效的调用堆栈,使用Windbg动态调试去分析定位_visual studio 堆栈分析
当前位置:
article
> 正文
将句子表示为向量:无监督句子表示学习(sentence embedding)
作者:天景科技苑 | 2024-07-14 20:05:54
赞
踩
将句子表示为向量:无监督句子表示学习(sentence embedding)
本文主要是用作自己学习记录笔记使用,如有侵权请联系删除即可。
原文链接:
将句子表示为向量(上):无监督句子表示学习(sentence embedding)
将句子表示为向量(下):无监督句子表示学习(sentence embedding)
【上篇】
References
Le and Mikolov - 2014 -
Distributed representations of sentences and documents
Li and Hovy - 2014 -
A Model of Coherence Based on Distributed Sentence Representation
Kiros et al. - 2015 -
Skip-Thought Vectors
Hill et al. - 2016 -
Learning Distributed Representations of Sentences from Unlabelled Data
Arora et al. - 2016 -
A simple but tough-to-beat baseline for sentence embeddings
Pagliardini et al. - 2017 -
Unsupervised Learning of Sentence Embeddings using Compositional n-Gram Features
Logeswaran et al. - 2018 -
An efficient framework for learning sentence representations
【下篇】
更详细的介绍可以参考论文作者的博客
Google AI Blog
(中文版)
。
5. 总结
基于监督学习方法学习sentence embeddings可以归纳为两个步骤:
第一步选择监督训练数据,设计相应的包含句子编码器Encoder的模型框架;
第二步选择(设计)具体的句子编码器,包括DAN、基于LSTM、基于CNN和Transformer等。
Sentence Embedding的质量往往由训练数据和Encoder共同决定。Encoder不一定是越复杂越好,需要依据下游任务、计算资源、时间开销等多方面因素综合考虑。
References
Wieting et al. - 2015 -
Towards universal paraphrastic sentence embeddings
Conneau et al. - 2017 -
Supervised Learning of Universal Sentence Representations from Natural Language Inference Data
Cer et al. - 2018 -
Universal Sentence Encoder
Google AI - 2018 -
Advances in Semantic Textual Similarity
声明:
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
Flutter
开发踩坑记录一:
Flutter
混合开发入门指南_
io
.
flutter
.embeddin...
本文介绍
Flutter
项目如何集成到原生项目中的步骤,以及注意事项_
io
.
flutter
.
embedding
.andro...
赞
踩
article
如何利用大
语言
模型
(
LLM
)打造定制化的
Embedding
模型
_llm
embedding
...
在探索大
语言
模型
(
LLM
)应用的新架构时,知名投资公司向量数据库是预处理流程中系统层面上最关键的部分。它能够高效地存储、...
赞
踩
article
NLP-词
向量
(
Word
Embedding
)-2013:
Word
2vec
模型(
CBOW
、
Skip
-...
一、什么是word embeddingword embedding是指把一个词映射到成一个实值
向量
空间的过程。二、wor...
赞
踩
article
Langchain
-
Chatchat
项目
:
1-整体介绍_
chatchat
embedding
...
基于
Langchain
与ChatGLM等语言模型的本地知识库问答应用实现。
项目
中默认LLM模型改为THUDM/chatg...
赞
踩
article
【
LangChain
-
chatchat
添加在线调用Openai的
embedding
模型:
text
-e...
【代码】【
LangChain
-
chatchat
添加在线调用Openai的
embedding
模型:
text
-embeddi...
赞
踩
article
Sentence
-
BERT
+
Milvus
实现
智能
问答
系统_
milvus
实现
问答
...
使用
Sentence
-
BERT
+
Milvus
实现
的
问答
系统_
milvus
实现
问答
milvus
实现
问答
...
赞
踩
article
词
嵌入
(
word
embedding
)...
举个例子,我们可以把“苹果”这个单词映射成一个向量[0.2, 0.9, -0.1, ...],把“香蕉”映射成[0.5,...
赞
踩
article
将
句子
表示
为
向量
(
上):无监督
句子
表示
学习
(
sentence
embedding
)...
1. 引言word
embedding
技术如word2vec,glove等已经广泛应用于NLP,极大地推动了NLP的发展...
赞
踩
相关标签
flutter
android
语言模型
embedding
人工智能
增强检索生成(RAG)
深度学习
自然语言处理
Word Embedding
langchain
python
数据结构与算法