通过 SiliconCloud 体验开源模型

SiliconCloud(硅基流动) 是一个以提供开源模型调用为主的平台，并拥有自己的加速引擎。帮助用户低成本、快速的进行开源模型的测试和使用。实际体验下来，他们家模型的速度和稳定性都非常不错，并且种类丰富，覆盖语言、向量、重排、TTS、STT、绘图、视频生成模型，可以满足 FastGPT 中所有模型需求。

如果你想部分模型使用 SiliconCloud 的模型，可额外参考OneAPI接入硅基流动。

本文会介绍完全使用 SiliconCloud 模型来部署 FastGPT 的方案。

1. 注册 SiliconCloud 账号

点击注册硅基流动账号
进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak

2. 修改 FastGPT 环境变量

  OPENAI_BASE_URL=https://api.siliconflow.cn/v1
# 填写 SiliconCloud 控制台提供的 Api Key
CHAT_API_KEY=sk-xxxxxx

3. 修改 FastGPT 模型配置

系统内置了几个硅基流动的模型进行体验，如果需要其他模型，可以手动添加。

这里启动了 Qwen2.5 72b 的纯语言和视觉模型；选择 bge-m3 作为向量模型；选择 bge-reranker-v2-m3 作为重排模型。选择 fish-speech-1.5 作为语音模型；选择 SenseVoiceSmall 作为语音输入模型。

alt text

4. 体验测试

测试对话和图片识别

随便新建一个简易应用，选择对应模型，并开启图片上传后进行测试：

可以看到，72B 的模型，性能还是非常快的，这要是本地没几个 4090，不说配置环境，输出怕都要 30s 了。

测试知识库导入和知识库问答

新建一个知识库（由于只配置了一个向量模型，页面上不会展示向量模型选择）

导入本地文件，直接选择文件，然后一路下一步即可。79 个索引，大概花了 20s 的时间就完成了。现在我们去测试一下知识库问答。

首先回到我们刚创建的应用，选择知识库，调整一下参数后即可开始对话：

对话完成后，点击底部的引用，可以查看引用详情，同时可以看到具体的检索和重排得分：

测试语音播放

继续在刚刚的应用中，左侧配置中找到语音播放，点击后可以从弹窗中选择语音模型，并进行试听：

alt text

测试语言输入

继续在刚刚的应用中，左侧配置中找到语音输入，点击后可以从弹窗中开启语言输入

alt text

开启后，对话输入框中，会增加一个话筒的图标，点击可进行语音输入：

总结

如果你想快速的体验开源模型或者快速的使用 FastGPT，不想在不同服务商申请各类 Api Key，那么可以选择 SiliconCloud 的模型先进行快速体验。

如果你决定未来私有化部署模型和 FastGPT，前期可通过 SiliconCloud 进行测试验证，后期再进行硬件采购，减少 POC 时间和成本。

编辑此页面

通过 OneAPI 接入模型

通过 PPIO LLM API 接入模型

通过 SiliconCloud 体验开源模型

1. 注册 SiliconCloud 账号 link

2. 修改 FastGPT 环境变量 link

3. 修改 FastGPT 模型配置 link

4. 体验测试 link

测试对话和图片识别 link

测试知识库导入和知识库问答 link

测试语音播放 link

测试语言输入 link

总结 link

1. 注册 SiliconCloud 账号

2. 修改 FastGPT 环境变量

3. 修改 FastGPT 模型配置

4. 体验测试

测试对话和图片识别

测试知识库导入和知识库问答

测试语音播放

测试语言输入

总结