“我下个月要去美国出差。帮我找到最便宜的机票并预订。” 你不会对私人助理说这样的话。正如你可能已经猜到的,这是在对人工智能说的话! 又出现了一种可以最大限度提高办公效率的工具。 它叫做智能浏览器! 上面这句话最让我印象深刻的是,指令的接收者是网络浏览器,而这句话本身就包含了执行特定操作的指令。 网络浏览器正在从输出信息的工具演变为根据信息执行任务的工具。 如果自动化 Excel 任务是办公室工作人员的梦想,那么自动化网络浏览器任务同样令人梦寐以求。在我九年的办公室工作经历以及之后九年的自主创业经历中,自动化网络浏览器任务一直是我梦寐以求的事情。在此期间,我使用 Selenium 编写了大量的网络爬虫代码。我认为没有什么比编写网页爬虫代码更耗时且效果甚微的了。 但现在,我觉得我不再需要编写网页爬虫代码了。我可以直接让浏览器代劳。 智能浏览器使用逻辑逻辑模型(LLM)来解读用户的意图,它不仅分析网页的 DOM,还利用计算机视觉分析屏幕截图来理解环境,然后根据这种理解执行诸如点击按钮和输入信息之类的操作。这真是太理想了。 我想简要介绍一下 OpenAI 的 Atlas,一个
“我下个月要去美国出差。帮我找到最便宜的机票并预订。” 你不会对私人助理说这样的话。正如你可能已经猜到的,这是在对人工智能说的话! 又出现了一种可以最大限度提高办公效率的工具。 它叫做智能浏览器! 上面这句话最让我印象深刻的是,指令的接收者是网络浏览器,而这句话本身就包含了执行特定操作的指令。 网络浏览器正在从输出信息的工具演变为根据信息执行任务的工具。 如果自动化 Excel 任务是办公室工作人员的梦想,那么自动化网络浏览器任务同样令人梦寐以求。在我九年的办公室工作经历以及之后九年的自主创业经历中,自动化网络浏览器任务一直是我梦寐以求的事情。在此期间,我使用 Selenium 编写了大量的网络爬虫代码。我认为没有什么比编写网页爬虫代码更耗时且效果甚微的了。 但现在,我觉得我不再需要编写网页爬虫代码了。我可以直接让浏览器代劳。 智能浏览器使用逻辑逻辑模型(LLM)来解读用户的意图,它不仅分析网页的 DOM,还利用计算机视觉分析屏幕截图来理解环境,然后根据这种理解执行诸如点击按钮和输入信息之类的操作。这真是太理想了。 我想简要介绍一下 OpenAI 的 Atlas,一个