在2005年7月的一个晴朗的日子里,黛比·罗伊(Deb Roy)和鲁帕尔·帕特尔(Rupal Patel)脸上洋溢着所有初为人父母的人共有的笑容。他们在波士顿家中的走廊上停下来,拍照留念,并高兴地谈论着襁褓中的宝贝儿子。
但是,这对看起来很正常的郊区夫妇和其他父母并不完全一样。罗伊是麻省理工学院的人工智能和机器人学专家,帕特尔是东北大学闻名的演讲和语言专家。多年来,他们一直计划收集有史以来全面的家庭视频。
走廊的天花板上,闪烁着两个不显眼的黑点,每个黑点都有一枚硬币大小。开放式生活区和餐厅有更多这样的黑点。整个房子总共有25个——14个有麦克风的摄像头和11个鱼眼相机——这是他们从医院返回时准备启动的系统的一部分,目的是记录新生儿的一举一动。
这项计划十年前就在加拿大开始了——但事实上,罗伊在他六岁的时候就制造出了他的靠前台机器人,20世纪70年代回到温尼伯后,他从未真正停下来过。当他的兴趣变成了一项事业时,他对机器人的大脑感到好奇,致力于研究到底需要什么才能让机器思考和说话。“我认为,我可以读一些关于孩子们如何做的文献,这将帮助我一个构建语言和学习机器人的蓝图,”罗伊告诉我。
一天晚上吃晚饭的时候,他向正在攻读人类语言病理学博士学位的帕特尔吹嘘说, 他已经发明了一种机器人,学习方式与孩子们的学习方式是一样的。 他确信,如果机器人得到的输入和孩子们一样,机器人就可以从中学习。
Toco不仅仅是一个安装在 Meccano 框架上的摄像头和麦克风, 它有着乒乓球般的眼睛、红色的羽毛、弯曲的黄色喙,而且它很聪明。 罗伊利用语音识别和模式分析算法, 罗伊煞费苦心地教导 Toco 从日常言语的漩涡中区分单词和概念。与之前计算机用数字方式学习语言,理解单词与其他单词的关系的机器相比,罗伊的突破是创造了一种能够理解它们与物体之间关系的机器。被要求在一系列的物理项目中挑出红球时,Toco可以做到。
帕特尔在多伦多经营着一家婴儿实验室,罗伊经常飞到那里,去看看他能学到什么。在观察母亲和婴儿玩耍的过程中,他意识到自己教的 Toco 很差劲。“我没有正确地构建我的学习算法,”2007年,他向《连线》杂志解释说。“每一位家长都知道,当你和一个11个月大的孩子谈话时,你聊到的话题会很集中。如果你说的是一个杯子,你会一直坚持下去,你与杯子互动,直到孩子感到无聊,然后才不再谈论杯子。”
他的机器人一直在搜索,它在学习一个新物体时听到的每一个音标,但罗伊调整了它的算法,给它前沿的体验赋予了额外的权重,并开始给它提供一些帕特尔的婴儿实验室种的录音。突然,Toco开始以人工智能研究中从未出现过的速度建立起一个基本词汇。他感觉自己比以往什么时候都更接近自己的梦想了:建立一个能通过听和看物体来学习的机器人。但是,机器人需要依靠录音,而这些录音很难找到。
从来没有人真正研究过靠前个关键年龄段的孩子“在野外”会发生什么事情。研究人员的标准是每周进行一小时的观察——这就是帕特尔在实验室里研究母亲和婴儿的方式。如果你要研究婴儿学会说话的方式,你需要一个足够古怪的人,来建造一个带有隐藏录音设备的房子。
靠前次听说帕特尔和罗伊的实验,是我在伦敦一家综合学校当老师的时候。我教的大多数孩子都是在11岁的时候来到学校的,语言水平远远落后于我们对他们的期望。作为一个新手,我努力帮助他们赶上。然而,我所尝试的一切似乎都过时了,罗伊的方法是科学的。我希望,他的发现能够揭开一个可以帮助孩子们充分发挥潜能的秘密。如果我们能创造出像人类一样学习的机器,我们是不是还能开发出能帮助我们完善人类学习的机器?
在录制之前,罗伊和帕特尔达成了一些基本规则。这些录音只能提供给他们信任的内部研究人员。如果人们在任何时候对拍摄感到不舒服,他们会立刻扔掉这些录像。当需要保密时,系统可以暂时关闭。这是一个信念的飞跃,但他们一致认为这是值得的。他们的实验有能力开启对婴儿思维运作方式的新认识。
Toco是匹诺曹(Pinocchio), 罗伊是盖比托(Geppetto)。 但是他想知道真正的孩子能教给机器人什么。我想知道,那些家庭视频是否暗示了如何提高年轻的人类的学习能力。
1995年,两位研究人员,贝蒂·哈特(Betty Hart)和托德·里斯利( Todd Risley),发表了一项研究的结果,他们跟踪调查了42个堪萨斯城的家庭,比较了贫穷家庭中学龄前儿童与富裕家庭中学龄前儿童的经历。从婴儿九个月大开始,他们在两年半的时间里定期观察他们,在长达一小时的访问中记录和转录所有父母和孩子的讲话。研究结果很明显。一个孩子在三岁生日时听到的单词数量,与他九岁时的学业成功有非常强的相关性。这种差别几乎是不可估量的。他们估计,在四岁时,家庭富有的孩子比家庭穷的孩子多听到了3000万个单词。
“孩子们在入学时的技能差异问题比我们想象的更大、更棘手、更重要,”哈特和里斯利。 他们的研究表明, 尽早干预是值得的。“拖延的时间越长,改变的可能性就越小。”
尽管问题很严重,但解决办法看起来很简单。用语言来填补缺口就行了。哈特和里斯利的发现引发了一场今天仍在持续的焦虑感。在说英语的世界里,父母们疯狂地为他们的孩子抽认卡和大脑训练器。
但我在课堂上的经验表明,这种解释有点过于简单,把人脑的发展等同于计算机的输入和输出。我怀疑,婴儿可以从中学习的东西比你听到的单词要多得多。
宾夕法尼亚州天普大学(Temple University)的幼儿发展教授凯西·赫什-帕塞克(Kathy Hirsh-Pasek)似乎也同意这一观点。她写道,“就像快餐行业让我们摄入了大量的卡路里,我们所谓的‘学习型行业’让我们中的许多人相信,记住内容是学习成功和快乐生活所需要的一切”。她还写了一本有影响力的书,阐述了她的意见,爱因斯坦从不使用抽认卡,孩子们是如何真正学习的?为什么他们需要多玩,少记?我想她可能有一些答案。
赫什-帕塞克是早期儿童发展领域的传奇人物。她是12本书和数百篇学术文章的作者,是天普婴幼儿实验室的杰出教员,这个婴幼儿实验室的口号是“儿童教成人的地方”。
在实验室里,科学家们正在对“微小的人类”进行测试。研究人员已经开发出了精巧的实验来测量心率的变化,以显示8个月大的孩子已经知道的一些事情。“他们知道手机不会落在他们身上,”赫什-帕塞克说。“他们知道,如果我把这个盘子放在桌子上,盘子就不会穿过桌子。太神奇了。他们知道,如果我坐在你对面,你看不到我身体的底部。”
直到近,科学家们还倾向于认为婴儿是非理性的、不合逻辑的和以自我为中心的。1890年,威廉·詹姆斯(William James)在他的《心理学原理》中描述了婴儿的感官超负荷体验:“婴儿同时受到了眼睛、耳朵、鼻子、皮肤和内脏的攻击,感觉这一切就像一朵盛开的、嗡嗡作响的混乱之花。“这种理解有助于形成一种机械的学习观,而单词的重复才是重要的。但事实并非如此。
即使在子宫里,婴儿也在学习。在那个阶段,他们会听到声音。一小时大的孩子可以分辨出母亲的声音和别人的声音。他们来到这个世界,大脑通过感官刺激来学习。我们每个人都是天生的探险家,随时准备进行科学探究。如果我们要充分发挥我们的学习潜力,我们就必须了解这一点。
“我们进入这个世界,已经准备好了‘从环境中读取完美的暗示’,”赫什-帕塞克说。我想起了Toco。他也阅读环境——或者至少是他的眼睛(相机)看到的和耳朵(麦克风)听到的。但是机器人只能通过它们被编程的方式伸出手来,只能从它们被要求注意的刺激中学习。这将它们限制在一个小范围内,在这里的经验将塑造它们的行为。它们的方法毫无意义。但另一方面,婴儿是社会学习者。
“我们已经做好了与他人和我们的文化互动的准备,”赫什-帕塞克说。人类婴儿真正的天赋不仅仅在于他们从环境中学习——其他动物也能做到。人类婴儿可以理解他们周围的人,特别是理解他们的意图。
随着我们的发展,社会和文化的传播成为可能。语言是我们的出发点——把两个存在(being)的共同的意义归于一个抽象概念或符号的可能性。我们能否从婴儿的行为中看出这种行为的开端? 一岁以下的婴儿会与看护者进行亲密交谈。他们喋喋不休、眼神交流、交换东西、模仿对方的表情或动作。他们还用工具做实验,把它们塞进嘴里,或用东西敲打它们。
在莱比锡马克斯·普朗克进化人类学研究所,迈克尔·托马塞洛(Michael Tomasello)教授写道,我们的年轻一代“在一个不断出现新的人工制品和社会实践的环境中学习,这种环境在任何时候都代表着整个社会群体在整个文化史中的集体智慧”。
如果我们所有人,都要发挥作为学习者的潜力,我们必须回答的问题是,我们应该如何塑造这种环境。人类的大脑特别适合学习。长期的不成熟是一种有风险的进化策略,使我们在早期易受掠食者或疾病的伤害,并推迟了我们的繁殖能力,但回报是巨大的。我们可以积极地将来自环境和社会群体的大量前沿信息融入到我们的认知发展中。
科学家们早就认识到,关于“先天-后天”的争论是错误的。我们大脑的大量发育发生在头三年。在这些年里,大脑相对于环境而生长,形成与感官体验的相互作用。正如哈特和里斯利在他们对“词差”的研究中所表明的那样,这种经历会对个人的成长产生巨大的影响。
我们已经进化成为了一个教师和学习者的物种。我们理解他人的能力大约在第九个月到达,在发育的某个时刻,婴儿开始通过拿着或指向物体来检查别人的注意力。一年左右,他们可以跟随他人的注意力、凝视、触摸或聆听相同的东西。在15个月的时候,他们就能指挥。听着!看那边!共同关注是人类有意识学习的起点。这就是为什么婴儿不能从视频、音频或偶然听到父母的谈话中来学习说话。我们还没有进化到那种程度。这就是为什么我们和孩子交谈很重要。这也是为什么我们还不能从机器人身上学到东西。
理解我们如何学习的含义听起来像是常识:每一代人都应该确保下一代在他们早年就沉浸在当前文化的工具、符号和社会实践中。
为了寻找能培养我们自然能力的学习环境,我参观了Pen Green幼儿中心,这是北安普敦郡科尔比镇的一个幼儿发展专家中心。户外空间很冷,阴沉沉的,但这并没有吓到孩子们。在一片竹林旁,两个小男孩不停地拍打着流着水的水龙头。“别让我淋湿了!”他们高兴得尖叫起来。一位老师弯下腰,穿着印有“快一点,快一点”字样的T恤衫安慰一个蹒跚学步的孩子。 四个小女孩沉浸在严肃的谈话中, 心不在焉地在五颜六色的桶里挖沙子。
Pen Green在幼儿发展和家庭支持方面在全球都很出名。我和负责人安吉拉·普罗迪格(Angela Prodger)谈过,她刚刚接替了1983年成立该中心的传奇人物玛吉·威尔利( Margy Whalley )。上世纪80年代,科尔比是英国贫穷的城镇之一,那里的苏格兰移民工人因迁往南方的钢厂关闭而无家可归——1.1万人被解雇。该中心是下一代的生命线。如今,它为英国1400个不富裕的家庭提供服务。
我问她关于语言学习的问题。我们知道语言很重要,但是我在游戏时间没有听到太多的谈话。“如果我们不先解决个人、社会和情感发展问题,你就没有做好学习的准备,”普罗迪格说。她解释说,在孩子们能够掌握语言和语言的工具之前,你必须确保他们有一种“存在和归属感”。她认为,我们早期学习的方法常常跳过这些步骤。对我来说,这听起来像是一种享受,但不是必要的,但研究表明并非如此。
20世纪50年代,英国心理分析学家约翰·鲍尔比(John Bowlby)提出了“依恋”理论。他假设婴儿无法调节自己的情绪,所以他们在饥饿、悲伤或孤独时容易感到不安。需要一个看护者来帮助他们“共同调节”他们的情绪,随着时间的推移,这将教会孩子自我调节。如果父母的爱不能减轻负面的经历,他们就可以自己来。
这对在贫困或创伤环境中成长的儿童具有重大意义。这就是为什么Pen Green把孩子的存在和归属感放在靠前位。这也解释了我所执教学校的一些行为。在那里,我忽略了孩子们对成长环境中的压力做出反应的迹象,在Pen Green,他们与看护者密切合作,确保孩子们建立起牢固的、有利于他们在幼儿园乃至学校茁壮成长的关系。我一直相信孩子们想大搞破坏。我从来没有想到,他们可能只是受到环境的制约,以某种方式行事。“行为是孩子试图告诉你一些事情的一种迹象,”普罗迪格说。
在我们参观建筑时,普罗迪格告诉我,Pen Green的从业人员的技能是学会关注孩子们的想法,在他们自己还没来得及表达的时候,就能找到孩子们在发信号的证据。孩子们经常和我们交流,她告诉我。我们只需要学会理解。
“这是关于观察的,”普罗迪格说。“孩子们想探索什么?他们想知道什么?”
创造性玩耍是创造力、语言、数学和科学的基础。如果你太早开始使用抽认卡,你就失去了这个发展阶段。“这是关于自由的,”普罗迪格。“这是关于冒险的。”
他们每周带孩子们去森林几天,点燃篝火,让他们用剪刀做实验,骑BMX自行车。如果他们想在外面,他们就去外面。如果他们想回到温暖舒适的地方,小的婴儿在那里打滚,那就是他们要去的地方。环境决定了学习。成年人的目的只是为了和孩子们交流和分享注意力。阅读和写作可以等等。托儿所应该尽可能的社交化,在玩耍中要跟随孩子的脚步。在孩子们继续学习之前,我们必须确保他们属于自己。
孩子们在这里似乎很快乐,养成了归属感,并且通过玩耍为他们未来的成功打下基础。然而,我想知道,我们是否还能做更多的事情来加速早期学习。黛比·罗伊的机器人实验的意义在于,每时每刻都很重要。我们能承受这么多的机会吗?
“出生是美国不平等的较大根源,”经济学家詹姆斯·赫克曼(James Heckman)写道。如今的英国也是如此,在英国,能预测学业成就的因素是父母的收入。尽管我们每年有三分之二的孩子在英语和数学GCSEs中获得C或以上的成绩,但在学校免费用餐的孩子们中,这一数字下降到了略高于三分之一。赫克曼还指出,解决这种不平等的较好办法是在儿童的生活中尽早投资于儿童的发展。仅仅改变学校是不够的——我们必须比这更早。
在天普大学,赫什-帕塞克告诉我,我们不能简单地把孩子放在 iPad 前,指望他们赶上——但这并不意味着我们应该完全放弃智能机器。她的实验室的一些实验旨在缩小贫富儿童之间的发育差距。还有一些涉及诸如语言发展和空间意识等话题,并且都在以不同的方式使用技术。“机器做不到的是成为合作伙伴,”赫什-帕塞克告诉我。“它不是社交的。是交互式的,没有适应性。”
赫什-帕塞克的使命是改变我们对学习的想法,尤其是对贫穷的孩子。“我们有这样一个愿景,让贫穷的孩子了解基本知识非常重要,”她告诉我。“我们认为我们应该放弃课间休息——尽管我们知道身体有助于孩子学习,有助于培养更好的大脑。我们认为我们应该只做阅读和数学,去掉艺术和所有多余的东西。”
这沉重地压在了她身上。政策制定者和外行人歪曲了科学,以达到他们自己的目的。没有一个科学家认为抽认卡有效。没有一个科学家认为你应该从小就开始学习读写。这是政府的幻想。哈特和里斯利近的研究增加了语言课程的深度。2003年,心理学家帕特里夏·库尔(Patricia Kuhl)尝试教授美国婴儿普通话。分成三组(视频、音频和有血有肉的老师),只有那些接受人类导师教的人才能学到东西。2010年,一项对广受欢迎的婴儿爱因斯坦词汇构建DVDs的研究显示,观看这些DVDs的婴儿“对程序中的单词没有比从未观看过的孩子有更深刻的理解”。婴儿们也没有通过偶然间听到父母的谈话或收听广播来学习单词。不仅仅是单词,一个婴儿学习语言需要一个人。他们无法从屏幕上学习。
埃里卡·克里斯塔基斯(Erika Christakis)是一位幼儿专家,也是《The Importance of Being Little》一书的作者,他从多维度、基于思想的方法到二维命名和标签课程,描绘了学前教育的缓慢下降。弗吉尼亚大学的达普纳·巴索克(Daphna Bassok)想知道幼儿园是否真的和一年级新生一样。毕竟,对幼儿园5、6岁的孩子能够阅读的期望现在已经司空见惯。然而,所有的证据都与此背道而驰。剑桥大学的一项研究比较了5岁和7岁开始上正规读写课的儿童群体,这对11岁的儿童的阅读能力没有任何影响,“但从5岁开始上正规读写课的儿童对阅读的态度不那么积极,阅读理解能力也比晚开始上正规读写课的儿童差”。
这些发现很清楚:如果你在对故事、经历、感觉和情感有了基本的理解之前就开始解码,那么你就会成为一个更糟糕的读者。而且你更不喜欢它。在早期的学习中,像对待机器人一样对待孩子,你就是在把他们关一辈子。
凯西·赫什-帕塞克。
相反,赫什-帕塞克希望孩子们能够享受学习和成长的乐趣。除了孩子,她的另一个爱好是音乐。她经常唱歌,尤其是给孙女打电话的时候。
在她的书中,她提出了现代学习的六个C:协作(collaboration)、交流(communication)、内容(content)、批判性思维(critical thinking)、创造性创新(creative innovation)和自信(confidence)。我曾想,真理是从科学证据中得出的,这与许多教育政策不同。她说,如果我要从中拿走一件事,那应该是“从早期开始,我们就要向人们学习”。
正是这种洞察力促使一对郊区科学家按下了“记录”按钮。
当我们在麻省理工学院见面时,黛比·罗伊穿着黑色衣服,看起来依然年轻。头发上的几点斑白是11年为人父母的为数不过证据。回顾过去,Human Speechome Project——正如他和帕特尔的家庭记录实验所命名的那样——似乎是关于人工智能的千年之交热情的一个特殊爱好。他们总共捕获了9万小时的视频和14万小时的音频。200T的数据涵盖了他们儿子生命的前三年活动(以及他妹妹18个月)的85%。但现在,这些镜头已经积满了灰尘。
罗伊和他在麻省理工学院的团队开发了新的方法来可视化和研究他们获取的数据:“社交热点”显示了两条紧密相连的线,这是父母和孩子聚在一起聊天、学习或探索的温柔瞬间的视觉痕迹;“Wordscapes”是白雪皑皑的山脉,覆盖着整个客厅和厨房,较高的山峰耸立在人们常听到特定词汇的地方。结果证明,这些工具作为分析Twitter上谈话的一种手段,非常有利可图。罗伊和一名研究生花了十年时间建立了一家新的媒体公司。
罗伊现在回到了麻省理工学院。他的新团队叫做社会机器实验室。他放弃了制造能与人类竞争的机器人,转而把注意力放在增强人类学习上。让他改变主意的是抚养孩子的过程。
他儿子靠前次说一些不仅仅是胡言乱语的话的时候,罗伊和他坐在一起看照片。“他说‘fah’,”罗伊解释说,“但他实际上是指墙上的一条鱼,我们俩都在看。我知道这不仅仅是巧合,就在他看着它说出来之后,他转向了我。他有种类似于“啊,现在我明白了”的表情。他还不到一岁,但有一种有意识的存在,就是自我反省。”
罗伊不再相信你能把机器人培养成一个真正的人,甚至应该尝试一下的念头也消失了。开发一个只需要一个人的童年就能完全像一个年轻人的机器人似乎没有什么好处。人们就是这么做的。那是在你进入想象或情感、身份或爱情之前——这对Toco来说是不可能的。看着他的儿子,罗伊被“一个活生生的语言学习者的外表和行为的不可思议的复杂程度”冲昏了头脑。婴儿不仅仅是反刍;他们创造了,创造了新的意义,分享了感情。
学习的过程并不像他初想的那样,是一个解码的过程,而是一个无限连续、复杂和社会化的过程。他正在给他的孩子们读海伦·凯勒的自传,并被她靠前次的顿悟所打动。凯勒幼年时患了一种疾病,后来又聋又瞎,当她患上这种病时,她才七岁。“突然,我感到一种被遗忘的朦胧意识,”她写道,“一种回归思想的兴奋;不知怎么地,我明白了语言的奥秘。我当时就知道“w - a - t - e - r”是指从我手里流过的那种奇妙的、凉爽的东西。那个活生生的词唤醒了我的灵魂,给了它光明、希望、欢乐,让它自由!每件事物都有一个名字,每个名字都产生了一个新的思想。当我们回到屋里时,我碰到的每一件东西似乎都在随着生命而颤动。”
罗伊近开始与赫什-帕塞克合作, 因为她认为机器可以增强人类之间的学习, 但是永远不会取代它。
他发现人类的学习是公共的和互动的。对于机器人来说,语言的习得是抽象的、程式化的。对我们来说,它是具体的、情感的、主观的,随着生活颤动。智能的未来不会出现在我们的机器里,而是会出现在我们不断发展的头脑中。