LLM用户侧指南:从入门到精通
Abstract
LLM正迅速成为代码、数学、写作与其他需求的强大助手。然而,面对层出不穷的模型、复杂的API平台和多样的部署方式,如何根据自身特定需求(如编程辅助、数学解题、文本创作)选择最合适的工具链并有效利用?本篇《LLM用户侧指南》将基于站长的个人经验,深入探讨不同应用场景下的模型推荐,详细介绍通过API平台(如OpenRouter)便捷访问和实现本地部署以保障隐私/控制成本的策略,分享获取免费LLM资源的实用途径,并评测推荐如Cherry Studio等提升交互体验的用户友好型工具。本文作为一份面向非研究型用户的实用指南,帮助读者根据自身需求选择和使用 LLM。
模型推荐
代码/软件工程推荐Claude4。Claude一直在中文理解力,速度,性能上有很好的平衡。如果用量大/合租,也可以考虑开官方Pro。Artifacts,Project等功能都非常好用。这也是目前我唯一推荐开20刀会员的模型:
以人工智能导论第二次作业为例,在没有默认提示词的情况下,仅给出作业要求,它就能很好的给出项目框架,并在一个回答内就写完了所有代码
Artifacts也非常便于阅读,复制和上传代码到项目知识库
数学,复杂问题,文字创作等内容,Google的Gemini 2.5 Pro表现最佳,性能高,视觉理解力强,并且相较于其他顶级大模型便宜50% 。Gemini 2.5Flash,也给人很聪明的感觉。目前大模型的性能已经很好,如果是简单问题,选择Flash以获得更快解答,体验不比Pro差。2.5Pro的表现有时会让人十分惊喜,或许是目前最接近SOTA—— Stage of the art的模型。
它的小弟Gemini 2.5Flash几乎免费不限量使用,解决日常问题也足够了。(PS:就连qwen3-8b的q4,我觉得很多问题上也够用了)
开源模型领域,Deepseek R1 0528;Qwen 3 235B- A22B都是不错的选择。它们与Claude/Gemini的旗舰模型比起来也有一战之力,qwen在chat.qwen.ai可以使用。不过开源小模型毕竟稍微差一点,如果你只是个使用者,那Gemini 2.5pro为主,Claude Sonnet4专职代码,是最好的选择。
如果你有微调的需求,那么qwen3是目前最强的底模。能看到国产小模型秒掉Gemma 3,吾心甚慰。当然缺点也有,那就是这个模型本身能力太强了,微调不当可能还会倒退,上限高但是水成果就不方便了hhhhh
由于这是一篇针对用户侧的指南,开源小模型不做过多推荐,后续会有专题文章对开源小模型进行介绍,主观推荐,以及个人不严谨Benchmark
平台&本地部署
本地部署,先下结论,对于大多数同学不推荐。
原因无他,即使是售价超过8500的5080显卡,显存也只有16G,倒是可以跑qwen3 30b-a3b,但这种模型云端大把免费API,我觉得隐私保护属于特种需求,如果你所处理的内容真的隐私到无法上云,那么你应该有自己解决的信息带宽和财力,就不需要看这篇文章了。常见的游戏本基本上只有8G显存,勉强用用12B q4的模型,遑论核显本。
当然,各家的免费模型其实也不大,比如免费用户可用的GPT 4o-mini,在微软的一篇论文中被曝出只有8B,Gemini 2.0 Flash也有8b版本,各家开源小模型乃至千亿参数的模型也有大把免费资源,完全没必要再自行部署。
想玩玩本地部署的话,现在可以用LM Studio傻瓜式操作
目前使用体验最好的或许还是Claude官方Pro,不过大多数同学难以获取海外手机号和外币支付方式。
Gemini 2.5Pro可以在Google AI Studio免费使用,只要你有Google账号即可。之前那波白嫖相信大家也领到Google AI One Premium了,这里不再赘述。
https://aistudio.google.com/prompts/new_chat
觉得网页Chat不好用,或者更高级的使用者,亦或者有用Cline等coding工具的同学们,就可以请出API了。下面主要介绍三个可以方便获取API Key的平台:
- Google AI Studio
- OpenRouter
- Deepseek Platform
在Google AI Studio的左上角可以申请API Key,免费计划的用量:2.5Pro 50条/day;2.0Flash 2000request/day,非常可用
下面说说OpenRouter。作为一个聚合的API中转平台,你可以在这里调用几乎一切模型,超过300个
当然大部分模型是按量计费的,如果使用Claude4之类 15美元/百万输出Token的模型,可能一天就要消耗接近两美元。
不过,这里有许多Free模型,常见于小于70B的小模型,包括DeepSeek
用Google账号即可登陆,随后就可以Create API key并使用免费模型。
OpenRouter也有做的尚可的直接聊天界面,可以方便的使用和对比不同的模型。
第三个比较推荐的平台是DeepSeek Platform
不得不说DeepSeek配享太庙,作为一家中国公司,它让Agent开发等的API费用可以容易的报销,或许对于使用者它不够强,但对于研究者真是尤物。
用户友好型工具
只推荐Cherry Studio,完全免费,完全本地,功能丰富
你可以快速的聚合不同的助手和模型,在一个平台使用所有的模型。
在设置——模型服务导入第二步所讲的API Key即可
如果你只是想使用大模型,那么上面的知识已经足够了。欢迎关注我的后续内容,感谢阅读!