“自主人工智能即将到来”:真的像新闻头条所说的那样吗?
大约每10分钟,一篇关于人工智能“革命性突破”的新文章就会出现在我们的屏幕上。一种新方法,一种新功能,数十亿美元,人工智能代理。在过去的一年里,它一直在不停地增长,每天都在呈指数级增长。今天也不例外。
今天,又一篇标题写着“真正的自主人工智能即将到来”的文章。多年来我们肯定听过很多次类似的标题,但这次它读起来像是一个事实陈述,我们不太确定,但悉尼科技大学最新的人工智能进展可能会改变我们的想法。
那里的研究人员开发了一种新的方法,在大型数据集上训练人工智能,称为“扭矩聚类”。这种新方法的灵感来自于星系在浩瀚的宇宙中合并时发生的引力相互作用,并且(据说)可以在没有人类指导或参数的情况下有效和自主地分析大量数据;这与人工智能目前收集数据的方式截然相反。
在某种程度上,星系合并类似于自然学习的过程,其中“动物通过观察、探索和与环境互动来学习,没有明确的指示,”悉尼科技大学的林金腾(音译)教授说。
️首先,什么是聚类?
打个最简单的比方,想象你在一个派对上。你环顾四周,看到不同的人群挤在房间里,兴致勃勃地谈论着他们共同的兴趣:运动、烧烤、园艺,还有那个独自站在角落里的家伙。这是聚类最基本的思想。
当一个数据集被交给人工智能学习或分析时,类数据被分成组或模式进行有效处理。聚类方法有很多,其中K-Means、DBSCAN和分层聚类是最常用的。每种方法都有其优点和缺点:数据的复杂性、处理成本等。
更重要的是,每种方法都需要某种人为干预,无论是设置参数,如预定义集群的数量、epsilon距离、每个集群的最小点或层次距离度量 —— 等等。如果这些人为设置的参数中有任何一个不正确,输出将变化很大,甚至完全不正确。
你是否听说过“人工智能幻觉”,即人工智能大型语言模型(LLM)输出荒谬或错误的响应?虽然聚类问题并不是这些幻觉的完全原因,但如果相似的单词或模式被错误地组合在一起,它们确实会造成幻觉。想想看:聚会角落里的一个人,当他无意中听到“铲子传球”这个词时,他加入了体育小组。但实际上,他最好和园艺爱好者谈谈,因为他对铲子比触地得分了解得多。幻觉远不止于此,但这是另一篇或十篇文章。
监督学习 —— 人类标记、定义和设置参数 —— 耗时、昂贵,并且随着数据集复杂性的增长变得非常困难。扭矩聚类(Torque Clustering)的概念将把人类预定义的值和人类监督完全排除在等式之外,允许AI做出自己的预测,并更有效地查看数据集中的关系。
到目前为止,研究人员已经在1000个不同的数据集上测试了扭矩聚类算法,AMI得分为97.7%。AMI是一种“调整后的相互信息”分数,用于衡量数据簇的组织情况。运动配运动,园艺配园艺等等,即使运动和园艺都有类似的词,如“铲”、“草皮”和“种子” …… 你懂的。
相比之下,其他被认为是最先进的聚类方法的AMI得分在80%的范围内。
该研究的第一作者杨洁(音译)博士说:“扭矩聚类的独特之处在于它基于扭矩的物理概念,使其能够自主识别聚类,并无缝地适应不同的数据类型,具有不同的形状、密度和噪声程度。”“它的灵感来自星系合并时引力相互作用中的扭矩平衡。它基于宇宙的两个自然属性:质量和距离。”
要处理的事情很多,但在人工通用智能(AGI)的发展中确实显示出了希望。给一个空白的AI提供大量数据来“弄清楚”似乎既有趣又有风险。它真的是无参数和完全自主的吗?或者它是用隐藏的启发式来引导它的学习路径?
整个扭矩聚类(Torque Clustering)项目 —— 在过去几天里一直是头条新闻 —— 是开源的,任何人都可以在GitHub上找到它,所以,我们可能很快就会找到所有问题的答案。但自2024年5月以来,它一直可用,我还没有看到它作为人工智能训练的广泛采用的方法 …… 也许我们已经有答案了。
如果朋友们喜欢,敬请关注“知新了了”!