当前位置:   article > 正文

OpenAI API搭建的智能家居助手;私密大型语言模型(LLM)聊天机器人;视频和音频文件的自动化识别和翻译工具_有什么可以语音控制的本地ai模型

有什么可以语音控制的本地ai模型

✨ 1: GPT Home

基于Raspberry Pi和OpenAI API搭建的智能家居助手

在这里插入图片描述

GPT Home是一个基于Raspberry Pi和OpenAI API搭建的智能家居助手,功能上类似于Google Nest Hub或Amazon Alexa。通过详细的设置指南和配件列表,用户可以自行组装和配置这个设备,实现语音控制和智能家居管理的功能。

核心功能
  • 语音互动: 用户可以通过语音与GPT Home互动,询问天气、新闻、日历等信息。
  • 智能控制: 通过集成其他API和智能设备,如Spotify、Phillips Hue灯泡等,GPT Home能够控制家中的智能设备,实现灯光调节、音乐播放等功能。
  • 家庭助理: 设置提醒、闹钟、计时器,以及其他日常生活中的助理功能。
  • 教育娱乐: 提供互动游戏、教育内容,适合全家人使用。

GPT Home的搭建基于Ubuntu Server操作系统的Raspberry Pi,需要用户按照提供的配件列表购置必要的硬件,包括Raspberry Pi 4B、小型扬声器、OLED显示屏等。随后按照指南配置Wi-Fi、安装系统依赖、配置开机自启等步骤逐步完成。整个搭建过程需要一定的电脑操作能力,但教程提供了详细的指导和示例脚本,用户可以通过跟随教程逐步实施。

地址:https://github.com/judahpaul16/gpt-home

✨ 2: Secret Llama

在浏览器中运行的私密大型语言模型(LLM)聊天机器人

在这里插入图片描述

Secret Llama是一个完全在浏览器中运行的私密大型语言模型(LLM)聊天机器人,它支持Llama 3、Mistral等开源模型。借助于webllm提供的推理引擎,Secret Llama可以在不需要服务器和安装的情况下提供与ChatGPT相媲美的用户体验,并且还能够离线使用。最大的卖点是其绝对的隐私性 —— 任何对话数据都不会离开你的电脑。
Secret Llama是一个面向隐私保护、便捷性和开源爱好者的大型语言模型聊天机器人解决方案,适用于各种希望在保证数据隐私的前提下使用或探索LLM的场景。

地址:https://github.com/abi/secret-llama

✨ 3: Chenyme-AAVT

用于视频和音频的自动识别与翻译

在这里插入图片描述

Chenyme-AAVT(AI Auto Video-Audio Translation)是一个针对视频和音频文件的自动化识别和翻译工具。它允许用户快速将视频或音频中的语言内容识别出来,并转换成所需的目标语言字幕,再将这些字幕合并回原视频或与之配合使用。

主要功能:
  1. 全自动识别和翻译: 对视频或音频中的语言内容进行自动识别和翻译,生成字幕文件。
  2. 支持多种语言和模型: 支持多种语言识别和翻译,以及使用不同的模型,如推荐使用faster-whisper和大型模型以获得更佳体验。
  3. GPU加速和VAD辅助: 支持GPU加速以提高处理速度,同时利用语音活动检测(VAD)辅助识别以提升准确性。
  4. 多种字幕格式输出和预览: 支持输出多种字幕格式,并提供字幕预览以及视频预览功能。
  5. 高级功能: 支持字幕编辑、二次精翻,以及视频内容的总结和问答等AI辅助功能。

地址:https://github.com/Chenyme/Chenyme-AAVT

✨ 4: DeepSeek-V2

先进的混合专家(Mixture-of-Experts,简称MoE)语言模型

在这里插入图片描述

DeepSeek-V2是一个先进的混合专家(Mixture-of-Experts,简称MoE)语言模型,它在训练和推理方面均体现出经济高效的特点。总的来说,DeepSeek-V2的关键特性包括其强大的性能、经济的训练成本、以及高效的推理能力。下面用通俗的语言对DeepSeek-V2的功能进行详细总结,并说明使用DeepSeek-V2的情况。

聊天模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat
基础模型:https://huggingface.co/deepseek-ai/DeepSeek-V2

地址:https://github.com/deepseek-ai/DeepSeek-V2

✨ 5: LangChain Swift

为iOS、macOS、watchOS 开发的LangChain 的Swift库

在这里插入图片描述

LangChain Swift是一个为iOS、macOS、watchOS(部分支持)以及visionOS(测试版)优化的Swift库,它使得在这些平台上使用语言模型变得简单。

LangChain Swift是一套强大的工具集,它使得在苹果的多个平台上整合和使用语言模型变成可能。无论你是想要构建一个简单的聊天机器人,还是开发一个复杂的基于AI的应用程序,LangChain Swift都提供了必要的工具和接口。

地址:https://github.com/buhe/langchain-swift

在这里插入图片描述



更多AI工具,参考国内AiBard123Github-AiBard123

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/905171
推荐阅读
相关标签
  

闽ICP备14008679号