“我下个月要去美国出差,帮我找到最便宜的机票并预订。” 我不是在跟私人助理说这话。你可能已经猜到了,我是在跟人工智能说这话! 又出现了一种能最大限度提高办公效率的工具。 它就是智能浏览器! 上面这句话最让我印象深刻的是,指令的接收者是网络浏览器,而这句话包含的是执行特定操作的指令。 网络浏览器正在从单纯输出信息的工具演变为能够根据信息执行任务的工具。 如果说自动化 Excel 任务是办公室职员的梦想,那么我相信自动化网络浏览器任务也同样是他们的梦想。在我九年的企业生涯以及之后九年的创业经历中,自动化网络浏览器任务一直是我非常渴望实现的目标。在那段时间里,我还用 Selenium 编写了大量的网络爬虫代码。然而,似乎没有其他任务像编写网页爬虫代码那样耗时,却收效甚微。不过,现在看来我不再需要编写网页爬虫代码了。我只需让浏览器来完成这项工作即可。 智能浏览器使用逻辑逻辑模型(LLM)来解读用户的意图。它不仅通过计算机视觉分析网页的 DOM,还通过分析屏幕截图来理解环境,并在此基础上执行诸如点击按钮或输入信息之类的操作。这真是理想之选。 我想简要介绍一下 OpenAI 的 A
“我下个月要去美国出差,帮我找到最便宜的机票并预订。” 我不是在跟私人助理说这话。你可能已经猜到了,我是在跟人工智能说这话! 又出现了一种能最大限度提高办公效率的工具。 它就是智能浏览器! 上面这句话最让我印象深刻的是,指令的接收者是网络浏览器,而这句话包含的是执行特定操作的指令。 网络浏览器正在从单纯输出信息的工具演变为能够根据信息执行任务的工具。 如果说自动化 Excel 任务是办公室职员的梦想,那么我相信自动化网络浏览器任务也同样是他们的梦想。在我九年的企业生涯以及之后九年的创业经历中,自动化网络浏览器任务一直是我非常渴望实现的目标。在那段时间里,我还用 Selenium 编写了大量的网络爬虫代码。然而,似乎没有其他任务像编写网页爬虫代码那样耗时,却收效甚微。不过,现在看来我不再需要编写网页爬虫代码了。我只需让浏览器来完成这项工作即可。 智能浏览器使用逻辑逻辑模型(LLM)来解读用户的意图。它不仅通过计算机视觉分析网页的 DOM,还通过分析屏幕截图来理解环境,并在此基础上执行诸如点击按钮或输入信息之类的操作。这真是理想之选。 我想简要介绍一下 OpenAI 的 A
답변 3개
댓글을 작성하려면 로그인이 필요합니다.