【来源:虎嗅网】
大家好,我是李晓白。我们也是B站AI科技频道的@林亦LYi,平时会做很多趣味AI项目。
比如我们做了一个AI虚拟小镇,把6个不同的AI放在同一间房子里,让他们合租。我们在这个房子里提供了厨房、健身房,AI们可以自由选择是去外面上班、钓鱼,还是在家里宅着打游戏、谈恋爱。全网有上千万人和我们一起看这6个AI的生活,我们把这个项目称为“AI观察计划”。
我们还开了一家AI炒股公司,做了一个AI巴菲特,让他有着巴老爷子的投资理念和投资习惯。同时给他配了几个小弟,分别帮他看股票新闻、查K线、分析公司财报。我们还在年终的时候给它打了10万元现金让它去炒A股。
大家一定很好奇这个AI是赚了还是赔了,但今天我先卖个关子,大家可以去我们的视频里看一看。
因为我们平时做的就是创意项目,所以在评论区和后台也会收到观众们各种各样天马行空的想法。
有一天,我们就收到了这样一条特殊的私信。一位乡村教师找到我们,说:你们有没有什么办法让AI解读孩子们的心理健康呢?我们当时很好奇,也关心这个问题背后发生了什么。
于是,我们和这位老师进行了深入沟通,观察到了一类我们平时可能很少关注的群体,那就是乡村留守儿童。
这些孩子的父母平常都外出务工,所以他们在家只有爷爷奶奶或是其他亲戚的陪伴。据调查显示,我国乡村留守儿童的比例大概在25%。这个比例在一些偏远乡村会更大,超过50%。也就是说,一个班里可能有超过一半的小朋友没有父母的陪伴。
留守儿童的成长过程中相对缺乏父母的关心,也没有人可以倾诉烦恼,所以比较容易产生一些心理问题。据世界卫生组织统计,有15%的青少年是需要心理医生的介入和帮助的。而对我们国家来说,人均心理医生数量是严重不足的。
所以在乡村,老师不但是孩子们的老师,还是留守儿童的半个家长。大家可能听说过乡村小学缺老师的这件事。在一些学校,一个老师可能需要带两三个班级甚至两三个年级。他们哪怕想要多为孩子做一点什么,也是心有余而力不足。
而找到我们的这位老师是一位信息技术课的教师,他知道现在的前沿科技,但是他不太了解AI具体能做到些什么。他看了我们视频后,就想有没有可能一起合作,能否通过AI让老师们快速了解到学生们的心理健康状态呢?
心理测试的方式不是很多吗?
我们同样也想要帮助乡村老师和留守儿童们,于是,我们就对这个问题进行了一个初步的研究。
如今主流的心理测试方式是做问卷,大家坐在那几十分钟,填一份有几十道从ABCD里选的题目的问卷,然后根据答案就能测出来被试心理状态。
但心理问卷测试法有一个问题:如何让一个平时就活蹦乱跳坐不住的孩子,在教室里面花几十分钟,耐心地填完一份看起来和他们自身关系不大的问卷呢?这个问题本身在心理学上就是一个难题。而且孩子们填心理问卷的时候会有一些防御心理,所以说这种测试难以在乡村大范围地推广开。
那有没有什么办法让老师们不问、孩子们不说,也能快速测出孩子们的心理状态呢?
我们查了一些前沿的科技进展,发现脑电信号检测设备或者磁共振成像都可以快速地查出孩子们的心理病灶,且不用经过孩子主动的倾诉。但无论是从设备的复杂程度还是从昂贵程度来说,这些都不是乡村孩子们负担得起的。于是我们还是把注意力转移到了我们的专业领域,也就是AI上。
这是一个前些年比较火的项目,用计算机视觉来识别人物的面部表情从而分析出人物情绪。
如果我们先和真正的心理疾病患者沟通,采集他们的数据,制作成数据集,然后再用它和孩子们的面部数据进行比对,这样是不是就能筛查出来孩子们的心理状态呢?
但我们稍微研究了一下,就否决了这个创意。用AI加摄像头每天监控孩子们的面部表情,一听就是一件很侵犯隐私的事情,所以这个方式也不可行。
传统的测试没有那么好用,AI技术又不能过于侵犯孩子隐私,那怎么办呢?
用画画的方式做题可行吗?
我们又查了很多临床心理学上的测试手段,最后找到了房树人测验(House-Tree-Person),简称HTP测试。
房树人测验,顾名思义就是让受试者在一幅纸上画一栋房子、一棵树和一个人。然后只需要几分钟,心理医生就能从这幅画的房子、树木和人的排布和关系上分析出受试者的心理状态。
房树人测验属于绘画心理学的一个分支。绘画心理学就是说,人们在画画的过程中,会在画面上投射自己的潜意识,而受过训练的心理医生就可以通过对这些潜意识的观察分析出人们的心理状态。
我们当时一听,就觉得这个测试非常适合小孩子。因为只需要几分钟就可以把画好,画画的过程也非常好玩,小朋友也没有心理负担。
之后,我们就找到了绘画心理学专业的老师来沟通,却发现这个项目没有那么简单。它听起来好用,但是并没有大范围推广开的一个重要原因就是,房树人测验需要很客观的评价指标。
传统的心理问卷测试中,大家通过ABCD四个选项就能给出答案,但房树人测验不是,它必须得专业的心理医生才能看出来里边隐含的一些心理问题,比如说它线条是不是凌乱的、它的树木是不是笔直的、在画面中占比是怎么样的等等。而专业心理医生一般都不在乡村地区,所以说这个项目虽然好用,但目前只能在临床医学上使用。
那么,能不能用AI来评价房树人测验呢?理论上是可行的。大家都知道,这两年AI发展非常迅速,以ChatGPT为代表的大语言模型更是进展神速,完全可以让AI来做一些心理学的工作。
同时,AI的多模态能力也得到了巨幅提升。多模态就是说,AI可以像人一样看画面,还能轻松地分辨出画面中这两个苹果的区别,它们可以看出一个是绿色的可以吃的苹果,一个是黑色的数码品牌。
那么,如果我们把孩子们画的房树人测验直接“喂”给AI,会发生什么呢?我们试了一下,发现它会生成右边这种类似观感的东西。
经常用大模型的朋友可能知道,AI经常生成一些看似像模像样,实际经不起推敲的东西。这幅画的AI测试结果其实缺乏很多细节,也经常犯一些错误。
在《视觉语言模型是瞎的》(Vision language models are blind)这篇论文中就讲到,大模型的多模态能力其实还比不上近视眼的人类。它们经常会在一些低级任务上犯错误,比如分不清线条的粗细,也分不清阴影大小,甚至无法区分物体的遮挡关系。
我们当时测了主流的几个大模型,发现直接让它们做这个任务是行不通的。如果想让AI来做房树人测验,横在我们面前的就有这样“三座大山”。
第一就是模型缺乏专业知识。虽然大模型懂的很多,但只是泛泛而谈,并不深入。像房树人测验这种需要100多个指标的测试,它肯定没那么了解。
第二就是任务对它来说过于繁复。虽然大模型有注意力机制的帮助,但是让它看一幅画里边的这么多指标时,它很难抓住重点。
第三点就是模型的识图精度不够。
AI如何读懂孩子的画?
为了解决这些问题,我们开发了一套AI的工作流,搭建了一套多智能体的框架。
我们把这个项目拆成了两部分来做。既然AI很难一口气解决这个问题,那我们就把它分解开来,让AI一步一步地来完成。
第一步就是特征提取。我们把画面中的房子、树木和人分别安排给AI来做,也就是专人做专事。
我们分别做了4个智能体,其中House、Tree、Person就分别对应解读画面中的房、树、人。
拿这个house来举例。我们给AI灌输了如何解读这个房子的方式,同时只让它看画面中的房子。这样它的注意力就可以更加集中,准确率也会大大地提高。关于树和人的解读我们也是用同样的方式。
下一步,我们让一个叫overall的智能体负责总揽全局,它要看画面中除了房树人主体之外的信息,比如画面的远近、大小、物体的位置,还有孩子们的笔画、切断、线条、阴影等,以及画面整体的对称性之类的指标。
我们让4个小智能体把这些要素都干完之后,再把这些工作“喂”给后面这个AI,让它来生成分析报告。因为前面的准确率提升了,那么它后面要做的这些事的准确率也会相对提升。
刚才提到,房树人测验没有客观的评价指标,所以我们这个测试还请了专业的绘画心理学的老师持续地帮助我们纠正检测结果。我们从项目立项到做到老师满意,整整花了两个多月的时间。
等这个项目结果达到了老师的要求之后,我们把它放到了学校这边给老师试用。这个就是检测结果。当然,我们给老师看的是中文的,这是我们论文中的截图。
它第一行的内容就是,这份报告是否需要被老师特别留意。也就是说,老师如果想要筛选出来有心理问题、需要帮助的孩子,理论上只需要看这一条就够了,这也是老师给我们提出的要求。
如果大家用大模型写过报告,就会知道大模型经常生成那种又臭又长的结果,一眼抓不住重点。而老师们平时就很忙,所以他们希望一眼看到这个报告中的关键点,这样就可以尽量节省精力。
接下来,我们就把这个模型交到学校,让老师进行实地测试。那位老师测了大概几个班级,获得了300多份问卷。之后,我们把对应的结果按班级分类打包交给了老师。
当AI选择“罢工”
在测试结果中有这么一个小插曲。
这个404(网页或文件未找到)不是我们图片没显示出来,而是测试时有一份报告频繁地被系统报错了,大模型拒绝给出这份报告的结果。
我们就想,是不是这个报告出什么漏洞?因为AI也时常犯错。然而我们深入研究后发现并不是这样。
我们把那幅画单独提取了出来,大概长这个样子。
我在这里给大家声明一下,今天报告中所有房树人的画都是我们工作室的小伙伴自己画的,或者是在网上找的类似图片。因为画面是孩子心理的一个投射,我们不能把它暴露在大众的视野之下,所以也请大家放心,我们会注意保护孩子们的隐私。
总是,当时的那幅画和这张给人一种类似的观感,也就是扑面而来的负面情绪。我们人看到的就是这样的,把它“喂”给AI之后,AI们也看出来了这样的情绪。因此,在解读这份报告时,就会生成大量的负面词汇。
而由于现在大模型的审查机制做得比较完善,这种负面词汇很多的报告干脆就直接生成不出来了,被系统给禁了,所以我们就得到了刚才那个404的结果:AI死活不愿意解读这份房树人测验,而这正是我们想做的筛选中的一部分。
我们把这个结果告诉老师之后,老师们给我们的反馈是超出预期的。因为我们之前只是和心理老师做了测试,并不太确定这个结果的可信度。但根据老师的反馈,90%以上系统筛选出来需要留意的孩子,和老师平时的观测结果是符合的。
同时,还有一些老师平时没有留意到的孩子被筛选出来。在收到报告结果之后,老师和孩子们谈了心,发现一些孩子家里确实有一些情况是老师不知道的。
到这里,我们的项目其实就已经告一段落了。老师们可以通过AI来快速筛查需要他们特别留意的孩子,帮他们节省了精力,能对孩子多关心一点。
但是,在我们的视角里这个项目还有更深层次的一个意义:它证明了,我们的房树人测验是可以代替孩子们表达心声的。
很多小朋友本身就比较内向,不善于与人交流,也不敢寻求大人们的帮助。他们可能不太确定自己的心理是不是有问题,也不敢开口。他们会想,我会不会只是简单的不开心、其他小朋友会不会也和我一样、有没有可能我话说出来了会被小朋友笑话、大人们会觉得我不懂事……而这些情绪长期积压之后,就会对孩子们的心理产生影响。
我们的房树人测验可以在孩子们心理压抑的时候帮助孩子们发声,可以告诉大人们这个孩子是不是需要一些帮助,我们是不是可以多关心一下他。
也许AI识别的准确率还比不上人类医生,也永远无法替代人类医生做某些诊断和诊疗。但是我觉得对于一些偏远地区的乡村学校和当地的老师来说,对于那些没有心理医生资源的地区来说,这种AI衍生出来的能力是可能帮助到一些孩子的,哪怕只是一点点。这也是这位老师找到我们的初心。
可能与想象不同的乡村学校
后来,我们也跟着老师们线下探访了这所学校。
这就是我们在学校对面拍到的,这所学校建立在一片农田之上,方圆几公里都是这种大片大片的农田,一所学校孤零零地建立在这里。
在我们最开始的认知里,我理解的乡村学校可能是那种相对简陋一点的。但实际上我来到这所学校之后,发现它大大超出了我的预期。
这是学校里边的真实状态,是学校校舍的3D模型,而且是由老师和孩子们一起设计并且制作的。白色的部分是3D打印,黄色的部分是用激光雕刻做的。
这所学校里边的设备真的超出了我对乡村学校的认知。因为我本科是学机械电子工程的,像这些设备只有大学的实验室里边才有。我没想到在一个偏远地区的乡村小学,能看到我大学时才看到的东西。老师们也会带孩子做各种各样的手工和编程。
所以在这所学校,我能看到国家和政府对乡村振兴建设的成效,以及对于孩子们接受现代化教育做出的努力。
当然,我们也能看到老师们对孩子们的辛勤付出,是他们努力在帮乡村孩子们撑起未来。哪怕孩子们在很偏远的地区,也能接触到这种前沿的科技知识。
这些孩子们是幸运的,他们的老师非常尽心尽责,愿意帮助他们。但是,这种硬件上的缺失可以弥补,但是在他们成长过程中家庭角色的缺位带来的心理影响却难以弥补。也许,我们应该给乡村的老师和孩子们更多的人文关怀。
于是我们就想,能不能通过我们的技术和影响力,为这些留守儿童的健康成长多做一些什么呢?
我们根据这个项目发表了一篇论文,也把内容做了开源,号召更多人加入进来一起关注乡村留守儿童的心理健康。
我们把这个过程做成视频发布之后,有很多的观众来找我们。其中有海内外的儿童心理志愿者群体,也有研究心理学的博士生,还有一些在做了十多年公益儿童心理的心理医生,他们都觉得我们这个项目非常有意义,愿意加入进来。
这也是我们作为AI科技自媒体的愿景——科技向善,让AI帮助更多的人。
谢谢大家!
本文来自微信公众号:格致论道讲坛,作者:李晓白