LLM用户侧指南：从入门到精通

March 29, 2025 · 6 min read

BJTU 詹天佑学院在读 • 技术爱好者 • 硬件发烧友

Abstract

LLM正迅速成为代码、数学、写作与其他需求的强大助手。然而，面对层出不穷的模型、复杂的API平台和多样的部署方式，如何根据自身特定需求（如编程辅助、数学解题、文本创作）选择最合适的工具链并有效利用？本篇《LLM用户侧指南》将基于站长的个人经验，深入探讨不同应用场景下的模型推荐，详细介绍通过API平台（如OpenRouter）便捷访问和实现本地部署以保障隐私/控制成本的策略，分享获取免费LLM资源的实用途径，并评测推荐如Cherry Studio等提升交互体验的用户友好型工具。本文作为一份面向非研究型用户的实用指南，帮助读者根据自身需求选择和使用 LLM。

模型推荐

代码/软件工程推荐Claude4。Claude一直在中文理解力，速度，性能上有很好的平衡。如果用量大/合租，也可以考虑开官方Pro。Artifacts，Project等功能都非常好用。这也是目前我唯一推荐开20刀会员的模型：

以人工智能导论第二次作业为例，在没有默认提示词的情况下，仅给出作业要求，它就能很好的给出项目框架，并在一个回答内就写完了所有代码

Artifacts也非常便于阅读，复制和上传代码到项目知识库

数学，复杂问题，文字创作等内容，Google的Gemini 2.5 Pro表现最佳，性能高，视觉理解力强，并且相较于其他顶级大模型便宜50% 。Gemini 2.5Flash，也给人很聪明的感觉。目前大模型的性能已经很好，如果是简单问题，选择Flash以获得更快解答，体验不比Pro差。2.5Pro的表现有时会让人十分惊喜，或许是目前最接近SOTA—— Stage of the art的模型。

它的小弟Gemini 2.5Flash几乎免费不限量使用，解决日常问题也足够了。（PS：就连qwen3-8b的q4，我觉得很多问题上也够用了）

开源模型领域，Deepseek R1 0528；Qwen 3 235B- A22B都是不错的选择。它们与Claude/Gemini的旗舰模型比起来也有一战之力，qwen在chat.qwen.ai可以使用。不过开源小模型毕竟稍微差一点，如果你只是个使用者，那Gemini 2.5pro为主，Claude Sonnet4专职代码，是最好的选择。

如果你有微调的需求，那么qwen3是目前最强的底模。能看到国产小模型秒掉Gemma 3，吾心甚慰。当然缺点也有，那就是这个模型本身能力太强了，微调不当可能还会倒退，上限高但是水成果就不方便了hhhhh

由于这是一篇针对用户侧的指南，开源小模型不做过多推荐，后续会有专题文章对开源小模型进行介绍，主观推荐，以及个人不严谨Benchmark

平台&本地部署

本地部署，先下结论，对于大多数同学不推荐。

原因无他，即使是售价超过8500的5080显卡，显存也只有16G，倒是可以跑qwen3 30b-a3b，但这种模型云端大把免费API，我觉得隐私保护属于特种需求，如果你所处理的内容真的隐私到无法上云，那么你应该有自己解决的信息带宽和财力，就不需要看这篇文章了。常见的游戏本基本上只有8G显存，勉强用用12B q4的模型，遑论核显本。

当然，各家的免费模型其实也不大，比如免费用户可用的GPT 4o-mini，在微软的一篇论文中被曝出只有8B，Gemini 2.0 Flash也有8b版本，各家开源小模型乃至千亿参数的模型也有大把免费资源，完全没必要再自行部署。

想玩玩本地部署的话，现在可以用LM Studio傻瓜式操作

https://lmstudio.ai

目前使用体验最好的或许还是Claude官方Pro，不过大多数同学难以获取海外手机号和外币支付方式。

Gemini 2.5Pro可以在Google AI Studio免费使用，只要你有Google账号即可。之前那波白嫖相信大家也领到Google AI One Premium了，这里不再赘述。

https://aistudio.google.com/prompts/new_chat

觉得网页Chat不好用，或者更高级的使用者，亦或者有用Cline等coding工具的同学们，就可以请出API了。下面主要介绍三个可以方便获取API Key的平台：

Google AI Studio
OpenRouter
Deepseek Platform

在Google AI Studio的左上角可以申请API Key，免费计划的用量：2.5Pro 50条/day；2.0Flash 2000request/day，非常可用

下面说说OpenRouter。作为一个聚合的API中转平台，你可以在这里调用几乎一切模型，超过300个

当然大部分模型是按量计费的，如果使用Claude4之类 15美元/百万输出Token的模型，可能一天就要消耗接近两美元。

不过，这里有许多Free模型，常见于小于70B的小模型，包括DeepSeek

用Google账号即可登陆，随后就可以Create API key并使用免费模型。

OpenRouter也有做的尚可的直接聊天界面，可以方便的使用和对比不同的模型。

平台网址：https://openrouter.ai/

第三个比较推荐的平台是DeepSeek Platform

不得不说DeepSeek配享太庙，作为一家中国公司，它让Agent开发等的API费用可以容易的报销，或许对于使用者它不够强，但对于研究者真是尤物。

用户友好型工具

只推荐Cherry Studio，完全免费，完全本地，功能丰富

https://cherry-ai.com

你可以快速的聚合不同的助手和模型，在一个平台使用所有的模型。

在设置——模型服务导入第二步所讲的API Key即可

如果你只是想使用大模型，那么上面的知识已经足够了。欢迎关注我的后续内容，感谢阅读！

模型推荐​

平台&本地部署​

用户友好型工具​

模型推荐

平台&本地部署

用户友好型工具