GGUF
GPT-Generated Unified Format的缩写,是一种新型的文件格式,专门用于存储和交换大型机器学习模型的数据。
这种格式针对模型的快速加载和保存进行了优化,使其在推理方面更加高效。
GGUF可以有多重不同版本的量化,Q2、Q3、Q4、Q5、Q6、Q8,这些数字表示模型权重的位数,位数越高,模型的精度通常越高,但所需的存储空间和计算资源也越多。
不是所有GGUF格式的模型都能用LM Studio运行,可以打开下面这个链接,这里所有模型都可以用LM Studio运行:
量化是指将模型中的高精度数字转换为低精度数字,以减少模型的存储空间和计算需求。