当前位置:   article > 正文

开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能...

gpt 向量化

开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能。

找到一个开源库 baliance.com/gooxml/document,但是只支持docx后缀,下面是使用方法

  1. import (
  2. "baliance.com/gooxml/document"
  3. )
  4. func ReadDocxAll(fileName string) (string, error) {
  5. doc, err := document.Open(fileName)
  6. if err != nil {
  7. return "", err
  8. }
  9. text := ""
  10. for _, para := range doc.Paragraphs() {
  11. //run为每个段落相同格式的文字组成的片段
  12. for _, run := range para.Runs() {
  13. text += run.Text()
  14. }
  15. }
  16. return text, nil
  17. }

会把所有文本都读取到一块去。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/850483
推荐阅读
相关标签
  

闽ICP备14008679号