首页
学习
活动
专区
圈层
工具
发布

#LLM

LM Studio本地LLM运行全攻略

胖头鱼的鱼缸

上一篇文章发布后,不少朋友私信询问我本地运行LLM并供AI Agent调用的具体方案。本期就结合ROG 幻 X 2025(128GB 版本)硬件环境,完整演示L...

000

ARC3高分 一夜全开源

CreateAMind

https://www.kaggle.com/competitions/arc-prize-2026-arc-agi-3/code

500

LLM Coding Agent 的代码记忆革命:Tree-Sitter 知识图谱深度拆解

heidsoft

GPT-4.5 和 Claude Sonnet 在代码补全任务上已经接近人类程序员水平。然而,当对话式 LLM Coding Agent(如 Claude Co...

500

大模型安全学习专题(8):从 NIDS 到 AI Firewall——LLM 安全的技术架构演进

heidsoft

在前七讲里,我们从攻击技术(Series 01-03)、到供应链风险和持续性威胁(Series 04-05)、到事件响应和治理框架(Series 06-07),...

900

大模型安全学习专题(6):LLM 安全事件响应与处置——从检测到闭环的完整流程

heidsoft

这一讲专门讨论 LLM 安全事件的响应与处置:告警响应流程的设计、临时限速与永久封禁的决策权衡、取证与数据保留的完整性要求、账户恢复与攻击者追踪的实战方法、以及...

800

大模型安全学习专题(4):供应链风险——LLM API 调用链的全局可观测性

heidsoft

https://github.com/heidsoft/heidsoft-nids

600

大模型安全学习专题(2):TCP 分包:LLM 安全检测的"盲区"——为什么你看到的流量不是完整的流量

heidsoft

很多人理解 HTTP 请求的时候,会把它想象成一封信——你写好信纸,装进信封,邮局会把这封信完整地送到收件人手里。但实际的网络传输不是这样的。

500

LLM 十大安全风险 - 概述

用户11705094

2024 年 11 月 18 日,OWASP 发布了 2025 版 Top 10 LLM 安全风险清单,标志着AI安全从防漏洞向管生命周期的质变。。

700

07-PPO 在 LLM 后训练里真正训练了什么

anzhsoft

上一组最后一篇按 fit()走完了一轮 PPO/GRPO step。进入第二组,我们换一个视角:同一轮 step 里有 actor、rollout、refere...

3910

WorkBuddy LLM 成本控制与架构实践

山野大叔

在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中,验证了一个结论:

2110

31%:LLM 修 Bug 的真正天花板 ?

山野大叔

我们耗时多轮迭代,持续优化 LLM 自动修 Bug 流水线,从数据喂入、评分机制、Bug 分类到任务调度,完成了全链路架构优化。所有前置工程问题悉数解决,流水线...

1310

89 天 15K stars:HKUDS 把 LLM Agent 套到量化交易

智能时代蛮子

vibe-trading 是一个让 LLM 用自然语言驱动量化研究 + 受控实盘的 Agent 平台——它把 18 个数据源、450+ 公式 alpha、9 家...

4100

并非每个任务都需要使用最昂贵的模型——使用 PHP 编写的 LLM 分类器即可满足需求

Tinywan

当我几周前发布了 Neuron AI 官方路由包后,我收到了来自许多开发者的相同问题,只是措辞不同:它能将困难的请求发送给强大模型,而将简单的请求发送给便宜模型...

1510

告别Token焦虑:分享一些省Token指南

Kody-凯达

如果你正在频繁调用大模型API,你一定对“Token消耗”这件事又爱又恨——爱的是它让智能触手可及,恨的是它像水流一样悄无声息地溜走。

2310

AI可见性时代,我最近的八个观察

徐慎

AI可见性营销(AI Visibility Marketing)还处在一个很早期的阶段。与SEO相比,它最大的不同在于,我们几乎无法看到模型内部究竟如何做出判断...

3000

论文解读:LLM 不直接改代码,也能让程序跑快 3 倍?

七牛开发者

今天这篇论文「Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimiz...

5510

在 Langfuse 上配 LLM-as-Judge,五个真坑我替你踩过了

windealli

Langfuse 的在线评测核心是 LLM-as-Judge——也就是用一个大模型当裁判,来看你 Agent 的输出并打分。裁判自己也是个 LLM,所以你得先把...

11410
领券