最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

牛!手机上轻松部署大模型全攻略!

业界 admin 13浏览 0评论

当前AI革命中,大模型发挥关键角色,其理论基础在于Scaling Law。简单来说就是,随着数据、参数和计算能力的提升,模型能力增强,展现出小规模模型所不具备的“涌现能力”。众多AI企业推出开源大模型,规模按扩展定律实现指数增长。

然而不可忽视另一趋势,大模型体积正逐渐精简,为私有化部署提供可能性。 这在个人隐私保护要求高的场景中尤为重要。无需联网传输数据,直接在设备上运行的AI能增强用户信任。虽然云服务器上的AI可能性能更强,但安全性和可靠性令人担忧。

本文介绍几个适合私有化部署的最新大模型,并提供部署指导,手把手部署到电脑及手机。

一、开源大模型介绍

目前备受瞩目的大型模型,如ChatGPT和Bard,都是基于专有的闭源技术构建的。这无疑限制了它们的应用范围,同时也使技术信息的透明度变得模糊。

然而,开源AI大型模型(LLMs)正逐渐崭露头角,它们不仅增强了数据的安全性和隐私保护,还为用户节省了成本,降低了对外部依赖,实现了代码的透明性和模型的个性化定制。其中,Meta推出的Llama 3和微软的Phi3是开源大模型中的佼佼者,被誉为“小而美”的模型,且部署起来极为便捷。 这些开源大模型的出现,让我们看到了AI技术更加开放、透明和灵活的未来。

1、Llama 3

Meta 重磅发布两款开源Llama 3 8B与Llama 3 70B模型,供外部开发者免费使用。Meta表示,Llama 3 8B和Llama 3 70B是目前同体量下,性能最好的开源模型。

LLaMA是顶尖的开源模型,众多国内大型模型都基于它构建。经过人类反馈的强化学习(RLHF)微调后,它可以作为聊天机器人,适应多种自然语言生成任务,包括编程。基准测试显示,Llama 3 400B+的实力与Claude超大杯和新版GPT-4 Turbo相近,证明它在顶尖大模型中占据重要地位。

模型链接:https://llama.meta/llama-downloads/``GitHub项目地址:https://github/meta-llama/llama3

2. Phi-3

Phi是微软AI研究院新推出的开源小型语言模型,适用于商业环境,其特点是小巧高效。Phi系列包括Mini、Small和Medium三种规模。尽管Phi-3-Mini只有3.8B参数,但在关键测试中表现出色,与大型模型如Mixtral 8x7B和GPT-3.5相当,更大的版本在扩展数据集下肯定表现更佳。

Phi-3 技术报告:《一个能跑在手机上的大模型》https://arxiv/abs/2404.14219

小结

经过基准测试,Llama 3 8B和Phi3 3.8B小模型均表现出色。尽管它们的规模较小,但它们所采用的优化方法却具有一定的相似性。

对于大型模型的性能表现,关键因素在于框架、数据和参数。 鉴于参数规模较小,因此在如此小的参数下使用MOE框架并无实际意义。因此,这些模型主要在数据上投入大量精力,通过提高数据的数量或质量来优化小模型的性能。这为未来精简大型模型提供了重要的方向。

二、电脑部署的流程

首先介绍下,大模型部署利器Ollama,支持Llama 3、Mistral、Gemma等大型语言模型。

部署大模型只需两步:下载并安装Ollama,然后运行大模型。以Windows为例,从官网或文末下载Ollama,一键安装即可。

官网下载链接 https://github/ollama/ollama

安装完Ollama后,然后打开命令行,运行命令【ollama run llama3】 ,就可以下载并运行llama3大模型了(其他模型的运行命令如上),初次下载模型的会比较慢,下载完就可以愉快地对话了。

Ollama还支持其他功能如,图片等多模态输入、传入提示词调教模型等,具体可以看下文档。

三、手机部署的流程

与电脑相比,手机部署大模型意义更大,因为手机与生活更紧密,且手机上有大量个人数据,便于后续交互。现在很多人都有闲置手机,如果性能足够,运行大模型很有吸引力。我的旧手机是小米8,性能还可以。

手机上部署麻烦一些,类似于电脑部署,需要安装配置Linux环境。虽然安卓底层基于Linux内核,但重装Linux很难。不过,我发现了一个神器:Termux,可以在Android设备上运行许多Linux命令和工具。你可以从F-Droid官网下载安装Termux。

官网下载链接:https://github/termux/termux-app/releases

安装后打开Termux如下图。(如有要打开多个Linux窗口,左上角右滑点击New session就可以。)

要在手机上部署大模型,使用Termux+Ollama就成了。

首先,通过Termux的proot-distro功能,可以方便地安装一个Linux系统,如Ubuntu、Debian或Arch Linux。这样,在Android设备上就能拥有完整的Linux环境,以安装和运行Linux软件包。

// 先来安装proot-distro``pkg install proot-distro``   ``//使用proot-distro安装一个debian``proot-distro install debian``   ``// 安装成功后通过login命令就直接进入debian,为发行版启动一个root shell``proot-distro login debian

第二步,同电脑的流程,安装Ollama,下载及运行大模型。

//进入之后再来安装ollama``curl -fsSL https://ollama/install.sh | sh``   ``// 安装完毕可以查看ollama版本进行验证,出现版本号之后就可以使用ollama``ollama -v``   ``   ``// 后台开启ollama服务``nohup ollama serve &``   ``//运行大模型(其他模型的命令如下图,可通过ollama list查看模型)` `ollama run phi3

第一次要下载安装软件及大模型会比较慢,弄个一小时是要的。安装完了,后面都可以直接使用。只要运行login debian系统、Ollama服务、运行大模型后就可以使用了。

在手机上编写代码有种独特的魅力。虽然简陋,但一行行输入代码,看着屏幕上的输出,感觉非常酷。安装远程软件如Tailscale或todesk,用电脑编写代码更有趣。但需要注意,如果算力受限,大模型回复较慢,同时手机也会更耗电。

四、本地大模型的体验

模型表现: 大模型表现权威的数据可以看一些相关的测评,比如下图。

在此,我对手机本地部署的两个大型模型(llama3和Phi3)进行了简要的测试,并分享了我的个人体验。总体而言,llama3在各项表现中展现出更为稳定的特性,而Phi虽然有时会出现差错,但其响应速度却更胜一筹,使我在综合体验上觉得Phi更为出色。

响应速度,受限于手机或电脑的性能,如果电脑配备了GPU,响应可能会更为流畅。然而,在手机上的回复确实显得有些迟缓,有时甚至需要等待几分钟才能得到几个字的回应。值得注意的是,Phi3的回应速度明显快于llama3。尽管llama3的8B模型规模几乎是Phi3的3.8B模型规模的两倍。

中文能力方面, 这些开源模型确实存在一定的短板。当提问一些不常见的问题时,模型在回答过程中可能会突然转向英文。 此外,很多中文表达模糊不清,导致它们讲述的笑话内容也显得尴尬。这主要是因为高质量的中文数据集远远无法与英文数据集相提并论,这一数据层面的差异在未来很可能会进一步凸显。 在中文任务方面,我觉得llama的表现会比Phi3更为出色。如果你有兴趣,还可以尝试llama的中文变种——llama3-Chinese。

llama3

phi3

代码能力: 看着都有模有样的,但还是可以看出来Phi3有一些语法错误。

llama3

phi3

数学推理: 看着都还不错,Phi3感觉更好些。

llama3

phi3

安全性: 都有不错的合规意识

llama3

phi3

五、结语

尽管当前AI的落地应用尚显稀疏,但技术的成长毕竟需要时间,大型模型的高昂推理成本无疑是其普及的桎梏。

然而,正是小模型如Llama 3和Phi3的崭露头角,让我们看到了大模型实用化的曙光。 虽然小模型的训练成本较高,但其低廉的推理成本却为整体经济带来显著的节省,特别是在为海量用户提供服务时,高性能的小模型更让AI挣脱了成本的束缚,灵活应用于各种场景。想象一下,能够根据自身需求在本地部署定制化的AI,其魅力不言而喻!

展望未来,相信随着模型优化和定制AI芯片等技术带来的算力提升,更多“小而美”的AI大模型将逐渐融入我们的日常生活,让我们感受AI带来的变革!

本文到此为止,大家玩的愉快,别忘了点赞哦!

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文转自 https://blog.csdn/ytt0523_com/article/details/139960131?spm=1001.2014.3001.5501,如有侵权,请联系删除。

当前AI革命中,大模型发挥关键角色,其理论基础在于Scaling Law。简单来说就是,随着数据、参数和计算能力的提升,模型能力增强,展现出小规模模型所不具备的“涌现能力”。众多AI企业推出开源大模型,规模按扩展定律实现指数增长。

然而不可忽视另一趋势,大模型体积正逐渐精简,为私有化部署提供可能性。 这在个人隐私保护要求高的场景中尤为重要。无需联网传输数据,直接在设备上运行的AI能增强用户信任。虽然云服务器上的AI可能性能更强,但安全性和可靠性令人担忧。

本文介绍几个适合私有化部署的最新大模型,并提供部署指导,手把手部署到电脑及手机。

一、开源大模型介绍

目前备受瞩目的大型模型,如ChatGPT和Bard,都是基于专有的闭源技术构建的。这无疑限制了它们的应用范围,同时也使技术信息的透明度变得模糊。

然而,开源AI大型模型(LLMs)正逐渐崭露头角,它们不仅增强了数据的安全性和隐私保护,还为用户节省了成本,降低了对外部依赖,实现了代码的透明性和模型的个性化定制。其中,Meta推出的Llama 3和微软的Phi3是开源大模型中的佼佼者,被誉为“小而美”的模型,且部署起来极为便捷。 这些开源大模型的出现,让我们看到了AI技术更加开放、透明和灵活的未来。

1、Llama 3

Meta 重磅发布两款开源Llama 3 8B与Llama 3 70B模型,供外部开发者免费使用。Meta表示,Llama 3 8B和Llama 3 70B是目前同体量下,性能最好的开源模型。

LLaMA是顶尖的开源模型,众多国内大型模型都基于它构建。经过人类反馈的强化学习(RLHF)微调后,它可以作为聊天机器人,适应多种自然语言生成任务,包括编程。基准测试显示,Llama 3 400B+的实力与Claude超大杯和新版GPT-4 Turbo相近,证明它在顶尖大模型中占据重要地位。

模型链接:https://llama.meta/llama-downloads/``GitHub项目地址:https://github/meta-llama/llama3

2. Phi-3

Phi是微软AI研究院新推出的开源小型语言模型,适用于商业环境,其特点是小巧高效。Phi系列包括Mini、Small和Medium三种规模。尽管Phi-3-Mini只有3.8B参数,但在关键测试中表现出色,与大型模型如Mixtral 8x7B和GPT-3.5相当,更大的版本在扩展数据集下肯定表现更佳。

Phi-3 技术报告:《一个能跑在手机上的大模型》https://arxiv/abs/2404.14219

小结

经过基准测试,Llama 3 8B和Phi3 3.8B小模型均表现出色。尽管它们的规模较小,但它们所采用的优化方法却具有一定的相似性。

对于大型模型的性能表现,关键因素在于框架、数据和参数。 鉴于参数规模较小,因此在如此小的参数下使用MOE框架并无实际意义。因此,这些模型主要在数据上投入大量精力,通过提高数据的数量或质量来优化小模型的性能。这为未来精简大型模型提供了重要的方向。

二、电脑部署的流程

首先介绍下,大模型部署利器Ollama,支持Llama 3、Mistral、Gemma等大型语言模型。

部署大模型只需两步:下载并安装Ollama,然后运行大模型。以Windows为例,从官网或文末下载Ollama,一键安装即可。

官网下载链接 https://github/ollama/ollama

安装完Ollama后,然后打开命令行,运行命令【ollama run llama3】 ,就可以下载并运行llama3大模型了(其他模型的运行命令如上),初次下载模型的会比较慢,下载完就可以愉快地对话了。

Ollama还支持其他功能如,图片等多模态输入、传入提示词调教模型等,具体可以看下文档。

三、手机部署的流程

与电脑相比,手机部署大模型意义更大,因为手机与生活更紧密,且手机上有大量个人数据,便于后续交互。现在很多人都有闲置手机,如果性能足够,运行大模型很有吸引力。我的旧手机是小米8,性能还可以。

手机上部署麻烦一些,类似于电脑部署,需要安装配置Linux环境。虽然安卓底层基于Linux内核,但重装Linux很难。不过,我发现了一个神器:Termux,可以在Android设备上运行许多Linux命令和工具。你可以从F-Droid官网下载安装Termux。

官网下载链接:https://github/termux/termux-app/releases

安装后打开Termux如下图。(如有要打开多个Linux窗口,左上角右滑点击New session就可以。)

要在手机上部署大模型,使用Termux+Ollama就成了。

首先,通过Termux的proot-distro功能,可以方便地安装一个Linux系统,如Ubuntu、Debian或Arch Linux。这样,在Android设备上就能拥有完整的Linux环境,以安装和运行Linux软件包。

// 先来安装proot-distro``pkg install proot-distro``   ``//使用proot-distro安装一个debian``proot-distro install debian``   ``// 安装成功后通过login命令就直接进入debian,为发行版启动一个root shell``proot-distro login debian

第二步,同电脑的流程,安装Ollama,下载及运行大模型。

//进入之后再来安装ollama``curl -fsSL https://ollama/install.sh | sh``   ``// 安装完毕可以查看ollama版本进行验证,出现版本号之后就可以使用ollama``ollama -v``   ``   ``// 后台开启ollama服务``nohup ollama serve &``   ``//运行大模型(其他模型的命令如下图,可通过ollama list查看模型)` `ollama run phi3

第一次要下载安装软件及大模型会比较慢,弄个一小时是要的。安装完了,后面都可以直接使用。只要运行login debian系统、Ollama服务、运行大模型后就可以使用了。

在手机上编写代码有种独特的魅力。虽然简陋,但一行行输入代码,看着屏幕上的输出,感觉非常酷。安装远程软件如Tailscale或todesk,用电脑编写代码更有趣。但需要注意,如果算力受限,大模型回复较慢,同时手机也会更耗电。

四、本地大模型的体验

模型表现: 大模型表现权威的数据可以看一些相关的测评,比如下图。

在此,我对手机本地部署的两个大型模型(llama3和Phi3)进行了简要的测试,并分享了我的个人体验。总体而言,llama3在各项表现中展现出更为稳定的特性,而Phi虽然有时会出现差错,但其响应速度却更胜一筹,使我在综合体验上觉得Phi更为出色。

响应速度,受限于手机或电脑的性能,如果电脑配备了GPU,响应可能会更为流畅。然而,在手机上的回复确实显得有些迟缓,有时甚至需要等待几分钟才能得到几个字的回应。值得注意的是,Phi3的回应速度明显快于llama3。尽管llama3的8B模型规模几乎是Phi3的3.8B模型规模的两倍。

中文能力方面, 这些开源模型确实存在一定的短板。当提问一些不常见的问题时,模型在回答过程中可能会突然转向英文。 此外,很多中文表达模糊不清,导致它们讲述的笑话内容也显得尴尬。这主要是因为高质量的中文数据集远远无法与英文数据集相提并论,这一数据层面的差异在未来很可能会进一步凸显。 在中文任务方面,我觉得llama的表现会比Phi3更为出色。如果你有兴趣,还可以尝试llama的中文变种——llama3-Chinese。

llama3

phi3

代码能力: 看着都有模有样的,但还是可以看出来Phi3有一些语法错误。

llama3

phi3

数学推理: 看着都还不错,Phi3感觉更好些。

llama3

phi3

安全性: 都有不错的合规意识

llama3

phi3

五、结语

尽管当前AI的落地应用尚显稀疏,但技术的成长毕竟需要时间,大型模型的高昂推理成本无疑是其普及的桎梏。

然而,正是小模型如Llama 3和Phi3的崭露头角,让我们看到了大模型实用化的曙光。 虽然小模型的训练成本较高,但其低廉的推理成本却为整体经济带来显著的节省,特别是在为海量用户提供服务时,高性能的小模型更让AI挣脱了成本的束缚,灵活应用于各种场景。想象一下,能够根据自身需求在本地部署定制化的AI,其魅力不言而喻!

展望未来,相信随着模型优化和定制AI芯片等技术带来的算力提升,更多“小而美”的AI大模型将逐渐融入我们的日常生活,让我们感受AI带来的变革!

本文到此为止,大家玩的愉快,别忘了点赞哦!

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文转自 https://blog.csdn/ytt0523_com/article/details/139960131?spm=1001.2014.3001.5501,如有侵权,请联系删除。

发布评论

评论列表 (0)

  1. 暂无评论