本地化部署AI实施方法及测试#

起因：今日上午九点半是谷歌中国开发者大会，我观看了直播并注册了谷歌开发者身份，一般而言每次公布新模型我并不会感到惊讶，正如这次Google Gemini，令我比较意外的还是这次更新的模型仅仅只有2GB，这么低廉的成本引发了我的好奇心，借着这股劲，我部署了本地AI（Google Gemini 2GB模型还在开发中，尚未公布所以部署了其他模型）#

1
配置（个人配置，仅供参考）：
2
电  脑：联想拯救者Y7000P
3
处理器：AMD Ryzen 9 8945HX with Radeon Graphics  2.50 GH
4
显  卡：NIVDIA RTX 5060
5
内  存：16GB

ChatGPT oss-20B#

两类模型介绍#

由于OpenAI公司开源了两大AI，所以这次我们将使用其中的小模型进行部署 Click this你将会看到以下界面

这里我们可以根据自身电脑配置需求进行选择，这里的20B模型刚刚好可以满足我的电脑配置，所以这里我们将以20B模型进行演示，当然如果进不去OpenAI网页，下面我将提供两个模型对应的Hugging Face存储库

ChatGPT oss-20B ChatGPT oss-120B

什么是Hugging Face？

Hugging Face是通用的AI源代码存储地，在这里你可以找到绝大多是开源AI

下面是官方对于两类模型的简单介绍

gpt-oss-20b 适用于较低延迟和本地或特殊用例（210 亿个参数，其中 36 亿个活动参数）

gpt-oss-120b适用于生产、通用、高推理用例，适合单个 80GB GPU（如 NVIDIA H100 或 AMD MI300X）（117B 参数，其中 5.1B 活动参数）

这里我们选择LM studio作为载体来运行我们的AI，下面我将介绍LM studio的安装方法以及简单的配置下载

LM studio & 模型下载#

你可以进入LM studio官网，你将会看到一下页面这里直接下载即可，下载完成后，打开LM studio界面将如下所示

打开后，请复制以下代码再回到LM studio（选择合适自己的进行复制）

1
# gpt-oss-20b
2
lms get openai/gpt-oss-20b
3
# gpt-oss 120b
4
lms get openai/gpt-oss-120b

复制完成后应该会自动识别剪切板进行询问下载，如若没有显示，请打开左侧栏的发现，进去后搜索gpt-oss-20b（120b）直接下载即可，如下图等待全部下载完成后，加载我们的模型就可以直接使用啦！

LM studio 汉化#

在右下角的设置点击进去即可找到语言选择，选择自己喜好的语言即可

stable-diffusion-v1-4#

介绍#

这个模型是一个图片生成的模型（这个模型比较小，别指望生成精致的图片，图一乐即可哈哈哈哈哈）同样的可以在Hugging Face找到此模型 stable-diffusion-v1-4

安装必备库#

由于模型的特殊性，这里我们需要借助Python进行安装和使用，本模型依赖Pytorch插件，所以请先下载相关库

1
pip install --upgrade diffusers transformers scipy
2
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

diffusers：Hugging Face 提供的开源库，用来加载和运行扩散模型（Stable Diffusion 就是扩散模型）。
transformers：管理模型结构和相关任务的通用库。
scipy：科学计算库，扩散模型运行时可能用到。

全部安装完成后，请在终端输入以下代码来检查显卡加速是否生效

1
python -c "import torch; print(torch.cuda.is_available())"

若返回True即生效

首次使用操作方法#

请一定要看完全部再按照以下文档再自己选择合适的方法操作 请在代码编辑器中新建py文档进行首次下载和测试

1
import torch
2
from diffusers import StableDiffusionPipeline
3

4
def main():
5
    model_id = "CompVis/stable-diffusion-v1-4"
6
    device = "cuda" if torch.cuda.is_available() else "cpu"
7

8
    # 加载模型，float16 省显存（显卡显存低于4GB一定要用）
9
    pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
10
    pipe = pipe.to(device)
11

12
    # 如果显存有限，启用切片减少占用
13
    pipe.enable_attention_slicing()
14

15
    prompt = "a photo of an astronaut riding a horse on mars"
16
    print(f"Generating image for prompt: {prompt}")
17

18
    image = pipe(prompt).images[0]
19

20
    # 保存生成的图片
21
    image.save("astronaut_rides_horse.png")
22
    print("Image saved as astronaut_rides_horse.png")
23

24
if __name__ == "__main__":
25
    main()

当然这里默认模型安装路径就是和python安装路径是一样的，如果你的python和我的一样是在C盘内，那么我们可以通过更改一下步骤进行换到其他盘里面去例如，我想把模型下载到D盘里面的Models文件夹，那么我们可以对刚刚的代码进行以下更改

1
import os
2
import torch
3
from diffusers import StableDiffusionPipeline
4

5
# 先设置环境变量（可选）
6
os.environ["HF_HOME"] = "D:/models" # 可以更改到自己想到的地方
7
os.environ["TRANSFORMERS_CACHE"] = "D:/models" # 路径同上
8

9
def main():
10
    device = "cuda" if torch.cuda.is_available() else "cpu"
11
    pipe = StableDiffusionPipeline.from_pretrained(
12
        "CompVis/stable-diffusion-v1-4",
13
        cache_dir="D:/models",
14
        torch_dtype=torch.float16
15
    )
16
    pipe = pipe.to(device)
17
    pipe.enable_attention_slicing()
18

19
    prompt = "a photo of an astronaut riding a horse on mars"
20
    image = pipe(prompt).images[0]
21
    image.save("astronaut_rides_horse.png")
22
    print("Image saved.")
23

24
if __name__ == "__main__":
25
    main()

当然这里又出现了一个疑问，我们的生成的图像保存在哪里呢？注意这里

1
image.save("astronaut_rides_horse.png")

如果我们想要保存在桌面，我们可以进行如下修改

1
image.save("XXX/Desktop/astronaut_rides_horse.png")

这里的astronaut_rides_horse.png名称可以自定义

初次运行会进行模型下载工作，这里我们只需要等待即可（需要梯子）等到Image saved出现，那么恭喜你，首次使用大获成功

后续使用的操作#

如果说我们再次运行上面的程序，那么就会造成二次下载，所以现在我们需要编写一个新程序进行后续长期的使用下面我将提供一套标准模板进行调用模型和使用（支持单次/多次使用）

1
import os
2
import torch
3
from diffusers import StableDiffusionPipeline
4

5
# -----------------------------
6
# 1. 设置模型路径和缓存目录
7
# -----------------------------
8
MODEL_PATH = r"D:/models/stable-diffusion-v1-4"  # 本地模型目录
9
OUTPUT_DIR = r"D:/models/output"                 # 输出图片保存目录
10

11
os.makedirs(OUTPUT_DIR, exist_ok=True)
12

13
# -----------------------------
14
# 2. 初始化模型 (只做一次)
15
# -----------------------------
16
device = "cuda" if torch.cuda.is_available() else "cpu"
17

18
pipe = StableDiffusionPipeline.from_pretrained(
19
    MODEL_PATH,
20
    torch_dtype=torch.float16  # 节省显存
21
).to(device)
22

23
pipe.enable_attention_slicing()  # 显存优化，尤其显卡小于8GB
24

25
# -----------------------------
26
# 3. 定义生成图片函数
27
# -----------------------------
28
def generate_image(prompt, filename):
29
    """生成图片并保存"""
30
    image = pipe(prompt).images[0]
31
    save_path = os.path.join(OUTPUT_DIR, filename)
32
    image.save(save_path)
33
    print(f"Image saved: {save_path}")
34

35
# -----------------------------
36
# 4. 批量生成示例
37
# -----------------------------
38
prompts = [
39
    ("a fantasy landscape with dragons", "dragons.png"),
40
    ("a futuristic city at sunset", "city.png"),
41
    ("a cute cat wearing a spacesuit", "cat.png")
42
]
43

44
for prompt_text, filename in prompts:
45
    generate_image(prompt_text, filename)
46

47
print("All images generated!")

请根据需求，适当修改上述代码当我们终于搞定时，去运行结果发现又报错了，这个原因是因为我们的初次下载的模型所在目录是有问题的，我们需要重新构建文件树首次下载的文件树是

1
D:.
2
├─blobs
3
├─refs
4
└─snapshots
5
    └─133a221b8aa7292a167afc5127cb63fb5005638b
6
        ├─feature_extractor
7
        ├─safety_checker
8
        ├─scheduler
9
        │  └─.ipynb_checkpoints
10
        ├─text_encoder
11
        ├─tokenizer
12
        ├─model_index.json
13
        ├─unet
14
        └─vae

这个时候我们需要在同文件夹下（我原来下载在Models文件夹下，那么同样在Models里面新建一个stable-diffusion-v1-4文件夹，把snapshots/133a221b8aa7292a167afc5127cb63fb5005638b/下所有文件（夹）复制进去然后把这个新文件夹的路径设置为Model Path即可使用以下是示例生成图片所以说玩玩乐呵乐呵就行了