FydeOS AI 使用指南
上次更新:2024-05-30
什么是 FydeOS AI?
FydeOS AI 是专为 FydeOS 打造的系统级 AI 助手,支持接入主流 AIGC 服务,并具备运行本地模型的能力。
FydeOS AI 设置入门
系统要求
目前 FydeOS AI 处于实验阶段,目前仅在 openFyde 上线。 支持的机型有:
- openFyde - amd64
- rpi5-openfyde
- fydetab_duo-openfyde
- rock5b-openfyde
- orangepi5-openfyde
- edge2-openfyde
设置步骤
FydeOS AI 第三方 API
- 点击左下角启动器,在应用中找到 FydeOS AI,点击即可启动
- 在 FydeOS AI 设置页面的基础设置中选择服务提供商并填写相关信息,填写完成后便可以使用云端大模型对话功能
FydeOS AI 本地模型
- 前往 Hugging Face,选择你想使用的模型,并下载文件 XXX.rkllm
- 启动 FydeOS AI,在设置 - 基础设置页面选择本地模型
- 填写模型路径,如模型文件在下载文件夹内,路径为 Downloads/xxx.rkllm;若文件保存在其他位置,路径为「我的文件」下的相对路径
- 点击启动本地模型,稍等片刻即可启动本地模型进行对话
如何使用?
FydeOS AI 功能对普通用户非常友好
- 你可以在聊天框内自由的向 FydeOS AI 寻求帮助,也可以通过左侧的历史记录查看过往的对话内容
- 你可以通过语音输入对话内容,寻求快捷的帮助
- 你可以在选中文本时,按下快捷键 Ctrl+C+C(即按住 Ctrl,然后在两秒内按两次 C),可复制当前内容并在浮窗中询问 FydeOS AI。
开发者选项
配置文件
文件路径 | 描述 |
---|---|
config/config.yaml | 设定加载模型时的默认参数 |
config/fix_freq_rk3588.sh | 设置在运行模型时,CPU 和 NPU 频率提高 |
参数描述
参数名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
modelPath | const char* | 模型文件的存放路径 | - |
target_platform | const char* | 模型运行的硬件平台,可选择的设置包括“rk3576”或“rk3588” | - |
num_npu_core | int32_t | 模型推理时使用的 NPU 核心数量,若 target_platform 设置为“rk3576”,可配置的范围为[1, 2];“rk3588”可配置的范围则为[1, 3] | - |
max_context_len | int32_t | 设置 prompt 的上下文大小 | - |
max_new_tokens | int32_t | 用于设置模型推理时生成 Token 的数量上限 | - |
top_k | int32_t | top-k 采样是一种文本生成方法,它仅从模型预测的前 k 个最可能的 Token 中选择下一个 Token。这种方法有助于减少生成低概率或无意义 Token 的风险。更高的 top-k 值(如 100)将考虑更多的 Token 选择,导致文本更加多样化;而更低的值(如 10)将聚焦于最可能的 Token,生成更加保守的文本。 | 40 |
top_p | float | top-p 采样,也被称为核心采样,是另一种文本生成方法,从累计概率至少为 p 的一组 Token 中选择下一个 Token。这种方法通过考虑 Token 的概率和采样的 Token 数量来在多样性和质量之间提供平衡。更高的 top-p 值(如 0.95)会使生成的文本更加多样化;而更低的值(如 0.5)将生成更加集中和保守的文本。 | 0.9 |
temperature | float | 控制生成文本随机性的超参数,它通过调整模型输出 Token 的概率分布来发挥作用;更高的温度(如 1.5)会使输出更加随机和创造性,当温度较高时,模型在选择下一个 Token 时会考虑更多可能性较低的选项,从而产生更多样和意想不到的输出;更低的温度(例 0.5)会使输出更加集中、保守,较低的温度意味着模型在生成文本时更倾向于选择概率高的 Token,从而导致更一致、更可预测的输出;温度为 0 的极端情况下,模型总是选择最有可能的下一个 Token,这会导致每次运行时输出完全相同。 | 0.8 |
repeat_penalty | float | 控制生成文本中 Token 序列重复的情况,帮助防止模型生成重复或单调的文本。更高的值(例如 1.5)将更强烈地惩罚重复,而较低的值(例如 0.9)则更为宽容。 | 1.1 |
frequency_penalty | float | 单词/短语重复度惩罚因子,减少总体上使用频率较高的单词/短语的概率,增加使用频率较低的单词/短语的可能性,这可能会使生成的文本更加多样化,但也可能导致生成的文本难以理解或不符合预期。设置范围为[-2.0,2.0]。 | 0 |
mirostat | int32_t | 在文本生成过程中主动维持生成文本的质量在期望的范围内的算法,它旨在在连贯性和多样性之间找到平衡,避免因过度重复(无聊陷阱)或不连贯(混乱陷阱)导致的低质量输出;取值空间为{0, 1, 2}, 0 表示不启动该算法,1 表示使用 mirostat 算法,2 则表示使用 mirostat2.0 算法。 | - |
mirostat_tau | float | 选项设置 mirostat 的目标熵,代表生成文本的期望困惑度值。调整目标熵可以让你控制生成文本中连贯性与多样性的平衡。较低的值将导致文本更加集中和连贯,而较高的值将导致文本更加多样化,可能连贯性较差。 | 5.0 |
mirostat_eta | float | 选项设置 mirostat 的学习率,学习率影响算法对生成文本反馈的响应速度。较低的学习率将导致调整速度较慢,而较高的学习率将使算法更加灵敏。 | 0.1 |
引用自 Rockchip_RKLLM_SDK_CN.pdf