如果你在互联网上花费过一些时间,你可能已经遇到过reCAPTCHA验证框。这些验证框通常在你访问某些网站时首次出现,要求你勾选一个复选框来证明你是人类而非机器人。复选框上写着“我不是机器人”,大多数人会毫不犹豫地点击它,因为他们显然不是机器人。有时,点击这个复选框会要求你完成一系列视觉挑战,比如识别并点击所有包含摩托车的图片或所有有路灯的图片。这些看似简单的测试让人们误以为机器人无法通过。然而,事实并非如此。
网络机器人,通常简称为“bots”,已经发展得非常先进。它们被训练能够执行各种任务,从玩Runescape游戏到管理大量的X(原名Twitter)账户农场。因此,它们当然能够点击一个复选框或识别一个带有停车标志的图片。关键在于,reCAPTCHA的测试并不是要确定你是否能够完成这些点击,而是要分析你如何完成点击。
reCAPTCHA验证框通过比较你与机器人的反应速度和效率来判断你是否是人类。人类用户在完成这些任务时通常会有所犹豫,反应速度较慢,而机器人则能迅速且高效地完成任务。
什么是reCAPTCHA?
reCAPTCHA是谷歌旗下的一家公司,负责管理你在互联网浏览时屏幕上出现的那些小验证框。这些验证框上有一个标志,标志上有循环箭头,旁边写着“reCAPTCHA”。这是一个由谷歌提供的高级程序,旨在帮助网站管理员阻止恶意流量访问他们的网站。
reCAPTCHA取代了旧的CAPTCHA系统。你可能还记得那些原始的CAPTCHA,它们通常是由扭曲的字母和数字组成,有时还会被屏幕上的线条或斑点遮挡,使其难以辨认。遗憾的是,旧系统对于视力不佳的人来说相当困难,对普通人来说也可能非常令人沮丧。随着时间的推移,机器人逐渐学会了如何破解旧的CAPTCHA系统,因此谷歌收购了一家专门更新和改进CAPTCHA系统的公司,以应对日益先进的在线机器人。
CAPTCHA代表“Completely Automated Public Turing test to Tell Computers and Humans Apart”,这个名字虽然听起来有些复杂,但它准确地描述了这些看似简单的验证框的目的。它们旨在执行自动化的公共图灵测试。
图灵测试是什么?图灵测试是由计算机科学家艾伦·图灵在1950年设计的一种基本测试。这个测试的目的是区分参与者和计算机。如果一个参与者在与计算机的交互中无法被区分出是人类还是计算机,那么该计算机就通过了图灵测试。
那么,这些验证框究竟是如何区分机器人和人类的呢?这涉及到一些技术细节,但基本原理是,它们通过一系列的挑战和问题来测试用户的反应和能力。这些测试对于人类来说相对容易,但对于机器来说则比较困难。因此,用户在完成这些挑战时的方式和速度可以帮助系统区分用户是否为人类。
reCAPTCHA的工作原理
正如前面提到的,reCAPTCHA的测试并不是简单地看一个人或机器人是否能或不能点击那个提示你承诺“我不是机器人”的小框(尽管任何点击这个框的机器人都是在撒谎!一些机器人的胆子真大。)关键在于观察你点击这个框的方式。在某些任务上,机器人总是比人类更快、更有效率。例如,如果你编程一个机器人去点击这些验证框,机器人会直接快速地到达目标点并尽可能快地点击。光标会沿着最直接的路径直线移动到框上,导致非常快速的响应。响应的速度和鼠标移动的路径是reCAPTCHA判断的一部分。
你可能已经注意到,人类的行为是缓慢、低效且随机的。一个人不会以完全相同的方式两次拖动鼠标到验证框。人类的手太随机了,无法保证一致性。同样,他们不会总是以快速或高效的方式完成任务。人们可能会停下来阅读框上的文字或检查他们试图访问的网站。机器人永远不会做这些事情(除非被编程去做,但即使如此,它们的行为也会是僵硬和高效的。)
这种随机性和不规律性是reCAPTCHA用来区分人类和机器人的关键因素。人类用户在完成验证时会表现出更多的随机性和不规律性,而机器人则倾向于更加直接和高效的方式。
这对于使用笔记本电脑上的触控板的的人来说尤其如此。触控板总是会导致一条随机且游移的路径朝向“我不是机器人”的框,这几乎可以保证每次都能通过。
如果你点击得太快,你可能会被要求完成一个视觉拼图。新的视觉拼图是原始模糊文字的直接进化。Cloudflare说,即使是最先进的AI目前仍然难以从混乱或模糊的图像中挑选出特定的物体。人类不会有这样的问题。被要求区分模糊的自行车、摩托车和踏板车的图片是一个AI目前难以通过的测试。
隐蔽且难以察觉的reCAPTCHA技术
部分网站已开始采用隐形验证码程序,这些程序会检查你的电脑中的cookies、浏览记录、鼠标移动轨迹和网络行为等,以判断你是否为机器人。谷歌的reCAPTCHA企业版系统会根据现有的信息给用户评分,以区分是人类还是机器人。
关于这个系统,你可以直接阅读谷歌官方的解释这里。
这种隐形的机器人信用评分机制虽然让人感觉有些侵犯隐私和令人不安,但谷歌表示,这有助于提升用户体验的流畅性。很多人在屏幕上看到验证码框时都会感到烦恼或挫败,因为它会中断他们的正常工作流程。而这套系统则允许用户在无需经过这些繁琐测试的情况下访问网站,同时仍然能够有效防止大量机器人攻击。
结语
如果你曾经好奇为什么机器人不能在出现“我不是机器人”的勾选框时直接点击,那你并不孤单。实际上,机器人点击电脑屏幕上的任何内容并没有什么障碍。关键在于它们的点击方式。机器人被设计得快速高效,它们的点击速度、移动速度和处理速度总是比人类快。因此,这些测试就是观察你完成的速度和方式。
有趣的是,计算机科学家声称最新版的ChatGPT能够相对轻松地通过图灵测试,甚至是更高级的测试,这在网络活动中将使得人类和AI之间的界限变得更加模糊。
我们可能需要一种新的reCAPTCHA系统,以识别和过滤掉目前开发出的更高级、更类人的机器人。