数维服务有限公司

热点资讯

行业资讯

你的位置：数维服务有限公司 > 行业资讯 > 年薪300万的前沿部署工程师，要被「录屏教化」替代了

年薪300万的前沿部署工程师，要被「录屏教化」替代了

发布日期：2026-06-18 15:25 点击次数：149

机器之心发布

AI 正在学着操作电脑。

曩昔 AI 恢复问题，目下它径直启动帮你干活。填表格、录系统、整理文献，Anthropic 的 Claude Cowork、OpenAI 的 Codex 桌面版 —— 越来越多的 Agent 启动采纳果真使命流。

但当悉数这个词行业猖獗冲向桌面时，有一个问题被忽略了：AI 越来越会干活了，但正常东说念主该如何把我方的使命经过交给它？

目下主流 Agent 的逻辑是 “你写 Prompt → AI 扩充”，听起来合理，现实中却屡屡碰壁。

绽开里面系统、填表单、传附件、点提交…… 这些当作早已是职工的 “肌肉牵挂”，可要用笔墨描绘明晰，大多数东说念主径直卡住。更别说跨系统跳转、要求分支，许多东说念主连 Prompt 从哪儿写起都不知说念。

淌若东说念主说不清经过，AI 还能学会吗？

故道理的是，为了处罚这个清苦，硅谷催诞生了一个新作事 ——FDE（Forward Deployment Engineer，前沿部署工程师）。

他们驻场在客户公司，使命等于把业务东说念主员 “说不清” 的经过，翻译成 AI 能扩充的任务。他们既要懂技巧，又要老练果真的使命流。如今资深 FDE 的年薪中位数已高达 48.5 万好意思元。

FDE 的存在诠释了一件事：让东说念主学会教 AI，其实莫得那么容易。

那淌若能让 AI 我方学会透露业务经过，而不是靠年薪数十万好意思元的工程师来翻译，会若何？

有东说念主给出了谜底。

不会写 Prompt？那就演示给 AI 看

由清华大学计算机系博士团队创立的非十科技，最近发布了一款桌面 Agent 居品 ———Agivar。

与多数居品试图优化 Prompt 不同，它选拔从另一个标的切入：让 AI 主动学惯用户的使命经过。

你不错把它透露成一个会操作电脑的 “AI 职工”。

Agivar 的中枢才能叫作念 “录屏教化”，使用格局止境浅薄：绽开电脑录屏，像平时使命一样把经过操作一遍。录制落幕后，剩下的事情交给 AI。

听上去有点像早年的 “按键精灵”？但两者其实完全不同。

按键精灵记载的是坐标和当作 —— 鼠标挪动到 (300，500) 点击，机械重叠；Agivar 学习的是任务和逻辑 —— 它不雅察你使命的每一步，然后透露：为什么先绽开这个页面？为什么填这个数字？什么情况下跳过这一步？

Agivar 学到的不是 “下一步点那儿”，而是你的使命步调。它透露的是经过背后的规矩与判断逻辑，而不是单纯复现点击轨迹。即便界面改版、按钮移位，它依然能识别正确主见并扩充。

你教会它一次，它就能把这套经过褂讪、可回顾地扩充下去。

录屏三分钟，换回每天两小时

广东省某政务部门的使命主说念主员，每天都要在里面系统处理无数表单。绽开系统→选拔业务类型→填写信息→上传附件→提交审批，每天不异的经过都要重叠十几次。仅这一项使命，日常就要花掉一、两个小时。

这些系统莫得 API、莫得自动化接口，只可靠东说念主工点击。于是他尝试使用 Agivar。录制了一次完满经过，不到三分钟，日韩国产精品一本一区馆尔后这套经过便竣事了自动扩充，无谓再盯着屏幕冉冉操作。

录屏三分钟，换回每天两小时。

这么的场景远非个例。政务系统、企业 ERP、CRM、财务软件、里面 OA、采购系统…… 无数重叠、无 API、只高手工操作的经过，恰是数以万计正常职工的日常。信得过奢华时候的从来不是复杂使命，而是那些让东说念主麻痹的重叠。

别的 Agent 还在念念考，Agivar 还是作念收场

淌若你试用过一些桌面 Agent，可能会有一个直不雅感受：颖悟，但慢。

原因并不复杂。因为大多数居品是径直调用通用多模态大模子 “硬解” 桌面任务：截图→上传云霄→推理→复返→扩充，再截图→再推理……

对于桌面任务来说，这意味着无数与任务无关的才能也被带进了扩充过程，每次点击都作陪五秒以上延伸。悉数这个词过程像一个刚学会电脑的新东说念主。

而 Agivar 选拔了另一条门路。

团队针对桌面任务场景磨练了专用的扩充模子，强化了桌面操作的才能。在此基础上，联想了 “大脑 + 小脑” 双层架构：

大模子（大脑）：透露录屏现实、拆解任务主见、绸缪扩充旅途、处理很是。

专用小模子（小脑）：界面识别、鼠标点击、键盘输入、高频当作扩充。

这与东说念主类神经系统止境相似。当你开车时，不会每踩一次油门都从头念念考交通规矩。大脑阐扬门路绸缪，小脑阐扬具体当作。

支握这套架构的，是团队基于清华大学自研深度学习框架 Jittor（计图）开垦的推理引擎，针对高隐隐、低延伸场景的桌面任务场景，团队对模子转机和扩充链路进行了专门优化，确保大小模子协同不恭候。

速率差距径直体目下数据上：

兼并台电脑扩充兼并个后台信息录入的任务，影院午夜福利电影某主流居品耗时 2 分 12 秒，Agivar 仅 57 秒，速率普及一倍以上。

单个任务差一分钟，差距概况不明显。但当任务形成 100 份报销单、300 条客户信息，或者一天的批量审批时，分钟级差距很快被放大成小时级本钱。

比速率更难的，是详情味

速率天然进军，但企业是否能让 Agent 走进出产环境，顺心的不是快，而是稳。

大模子是概率系统。第一次点 A，第二次可能点 B，第三次换个按钮 —— 这在写诗时是创意，在财务录入、公约存档里却是风险。

AI 能否参加出产环境，拼的从来不是上限，而是下限。

为了处罚详情味，Agivar 作念了三层联想：

磨练拘谨。用海量桌面任务数据，强化 “界面情景→用户意图→扩充任作” 之间的褂讪映射，减少 “发散”。

多重校验。里面多个 Agent 交叉考据 —— 绸缪、扩充、不雅察、复核，不同变装各司其职，每一步都有东说念主问：“点对了吗？界面还在预期情景吗？”

规矩管制。高频经过的关键操作节点、王人备不成出错的当作，径直写成尺度落幕的 “铁律”。扩充中枢要害时，系统会优先解任预设旅途，不正常贯通。

最终主见只消一个：兼并任务重叠扩充，走不异旅途，得到不异落幕。

毕竟，对于企业来说，出产环境不需要惊喜，只需要褂讪。

全栈自研，清华团队的硬核底牌

Agivar 的模子磨练到扩充框架，一说念由非十科技自研完成。团队的中枢成员来自清华大学计算机系，同期亦然清华自研的深度学习框架 Jittor（计图）的主要开垦者。

Jittor 以其易用性和后果上风，早已成为国内主流深度学习框架之一，这意味着 Agivar 对底层推理转机的优化，并非确立在第三方才能之上，而是具备从框架层到模子层的完满掌控才能。

Agivar 并非团队的第一个 “爆款”，此前团队推出的 AI 编程助手 Fitten Code，累计下载量当先 150 万，在多个主流插件平台评分第一。

同期领有大模子自研才能、深度学习框架研发才能以及百万级居品落地教化，这么的组合，在国表里同类赛说念中并未几见。

让每个东说念主都领有我方的 “AI FDE”

曩昔两年，AI 行业追赶的是更大、更强的模子。但时候走到今天，一个更现实的问题浮出水面：

AI 到底能不成信得过参加正常东说念主的使命流？

FDE 模式曾是谜底，但昂贵的本钱让大多数东说念主拒接三舍。

今天，Agivar 选拔了一条更朴素、也更普惠的旅途：把 “翻译” 和 “界说使命流” 的才能，交还给用户我方。无谓可怜地学 Prompt，不必篡改民俗。一次录屏演示，就能磨练属于我方的桌面 Agent。

目下，Agivar 已开启公测，支握 Windows 与 macOS。录一遍，让 AI 替你干活。

下载地址请看望：https://agivar.fittentech.com

从某种真理上说，“录屏教化” 信得过篡改的并不是交互格局，而是东说念主与 AI 之间的联结关系。

它让桌面 Agent 第一次有契机解脱复杂成就和专科门槛，信得过参加正常东说念主的使命流。淌若说曩昔的软件是在要求东说念主稳妥系统，那么下一代的 Agent 正在反过来稳妥东说念主。

而当每个东说念主都领有一个能够透露我方使命经过的 “AI FDE” 时，这场对于后果的变革，概况才刚刚启动。

转载请相干本公众号获取授权

投稿或寻求报说念：liyazhou@jiqizhixin.com

上一篇：旧年7月买1600元现已涨至7800元！DDR5内存一年涨幅419%

下一篇：Anthropic又摊上事了，夸大使用额度，被用户告状