解放双手!Claude AI智能助手让电脑操作更简单

2024年10月22日,Anthropic 公司宣布了Claude 3.5-Sonnet的重大升级,它引入了一项令人兴奋的新功能:直接操控用户的电脑来完成任务。这一更新立即引发了广泛讨论。

Claude 介绍

Claude是Anthropic公司开发的一款人工智能对话系统,类似于ChatGPT。由前Google AI科学家创立的Anthropic公司致力于通过最新的自然语言处理技术,让Claude具备理解、推理和响应人类需求的能力。Claude不仅擅长回答问题、提供建议,还能够执行代码生成、视觉分析、翻译等复杂任务,适合不同场景下的智能对话需求。

直接操作电脑完成任务

对于在编码领域的场景而言,这次 Claude 3.5 Sonnet 看起来觉得值得重点关注。官方重点介绍了除了效果提升之外的另一个创建性的功能:使用计算机。具体来说,开发者可以让 Claude 像人类一样使用计算机——通过查看屏幕、移动光标、点击按钮和输入文本,同时它提供了 API 可以让开发者进行集成。

文章开头的视频模拟了一个简单的场景,它依次完成了:

– 阅读 Excel

– 在 CRM 应用进行检索

– 填写一个表单并提交

整个过程中体现出了该模型的核心能力:

规划能力

将用户的原始任务进行拆解,转化为一系列动作依次执行。

信息提取分析能力

每个动作执行完成后,它会基于当前显示器的截图进行下一步分析,需要后续执行的动作。

电脑操作能力

针对分析出来的动作,真实控制电脑实现点击、滚动、输入等操作。

据介绍,电脑的操作是希望能让 Claude 完成真实世界的任务,同时,为了避免提供一系列单个工具来完成每个单个任务,它提供了一个 API 来教它通用的计算机操作技能,从而开发人员可以利用这一新兴能力来自动化重复的过程,构建和测试软件,以及进行开放式任务,如研究。

Claude 欢迎开发者共建安全生态

Claude团队高度重视人工智能的安全性,尤其是在应对潜在威胁(如垃圾邮件、虚假信息和欺诈)方面。他们采取了主动措施以促进其安全部署,开发了新的分类器,可以识别计算机使用的情况以及是否存在伤害。

 

Claude团队表述欢迎开发者在他们关于计算机使用开发的帖子中阅读更多关于这一新技能的研究过程,共同探讨如何进一步加强AI的安全性能,共同为用户提供一个更加安全、可靠的智能环境。

 

 

 

CN