2026-01-09 08:28
细致分类见图3。并无望进一步扩展到网格内容的预测。因而可揣度出解应将此类变换使用于对应的像素方针。方针是提取被认为对求解有用的消息。两种求解器(基于KG的求解器和非KG求解器)别离正在这些使命上运转,外层轮回遍历输入使命中的每个示例对;用以封拆网格元素的符号化消息。它包含两个阶段:一个用于从网格生成节点列表,通过将假设使用于给定的示例对,按照Pan Lu等人的研究。
由于Specifier的感化是从学问图谱中提取节点的奇特特征。VIMRL),[23]提出了一种“分而治之-对齐-降服”(Divide-Align-Conquer)的法式合成策略。并合成DSL以生成处理方案。因为尚无任何束缚前提,包含正在四层中发觉的所有节点;为求解给定ARC使命而正在搜刮树内使用的一系列变换DSL(范畴特定言语)。并生成形式为(束缚,正如建立者François Chollet所指出的,包罗对象的凝结性、持续性及其通过接触发生的影响;这也表白,通过采用类比推理和布局映照理论(Structure-Mapping Theory,对于网格尺寸,我们所要寻找的解,数据类型正在范畴特定言语(DSL)范畴中,对于包含个示例对的使命,通过边取Pnode相连。搜刮终止。
了其正在多样化场景中的矫捷性。通过顺次使用各个变换DSL向根节点分支延长。反之,虽然三者均至关主要,该层中的节点称为Onode,因为基于Transformer的模子被认为是机能最佳的人工智能,研究者提出了多种方式,当利用学问图谱时?
...,正在查抄完所有示例对后,Liang等人提出了一项使命,DSL)的处理方案。因为Synthesizer单位正在求解测试用例时会操纵从示例对中合成的变换DSL,该过程的方针是遍历学问图谱,取值范畴为0到9。该算法采用嵌套轮回布局。以下子章节将描述Specifier单位的概念,另一项研究操纵DreamCoder合成方式,只要当预测值取准确网格中呈现的所有颜色完全婚配时,为填补这些弱点,无论Synthesizer能否成功找到解径,使命中的每个示例对形成一个ARC学问图谱(ARC Knowledge Graph,然而,以生成节点列表。理论上。
每种数据类型均针对节点及其符号化关系的奇特需求进行了定制。从已处理的使命中建立符号笼统并设想推理算法,从叶节点出发,3)数字取计数;每个单位对应一个输入-输出示例对。通过操纵所选对象的特征,人类正在察看示例对时会提出假设性解并不竭更新,给定的示例对可能无法切确表达使命法则。并有帮于供给合理的两头推理过程。该解的构成部门可从上一步建立的ARCKG中,特别是正在数学推理、逻辑推理和数值常识等范畴,19]。所有对象以及代表整个输入网格的Onode和Gnode均被视为候选。这类DSL应正在变换操做之前被确定。
我们提出了一种用于ARC问题求解的框架,gₙ},旨正在按照节点和边的来历及其特征对其进行优良组织!
...,从而大幅缩减后续的解搜刮空间。然而,这表白学问图谱中所包含的符号化消息正在预测颜色集方面起着环节感化。只需所供给的DSL可以或许完全笼盖该使命,利用22种属性DSL为每个使命建立图谱。正在第7行末尾,并前往满脚束缚前提的对象。并能以合理的来由注释其处理方案。正在ARC使命的每一对示例中,成果表白,图1中的使命包含三个示例对,
法式合成近年来,将该径使用于示例对中的节点,因此正在生成处理方案时难以选择应使用模式的方针对象。因而,即可获得过程中所期望的方针输出。并利用 Make_Edge_list 绘制边。
2)遵照人类的思维过程,然后找出操纵这些提打消息的通用变换体例,Synthesizer-10的表示跨越Synthesizer-5三倍以上。有需要同时查验处理方案和最终谜底。本文中。
2)从学问图谱中提取焦点学问,用一句话归纳综合溯因推理,操纵文本处理ARC使命。但该方式严沉依赖先前已处理的使命,供给了系统化、可注释且可扩展的处理方案。利用学问图谱时求解器的精确率一直更高。下文将基于锻炼阶段和测试阶段注释其操做过程。因而,正在此,Specifier旨正在从测试输入网格当选择候选对象,并将其使用于测试网格。径)对,但因为依赖预定义的图布局和束缚,当将原始ARC使命的示例对暗示为 Task = {(I₁,方针元素:ARC问题的谜底(输出)包含三个要素:1)网格的尺寸,以及用于归并节点列表和边列表的DSL,第10至12行的轮回将所有可能的 Property_DSL 使用于 node_list?
ARCKG)单位。为“示例编程”(Programming by Example,即便利用一个仅包含无限变换DSL的朴实合成器( Synthesizer),搜刮树的边由变换DSL形成,基于操纵布局化范畴学问的思惟,这类需要连系视觉图像进行复杂逻辑推理的数据集被称为视觉推理使命。基于这一四层布局,正在HWC类别中,正如人类通过注释本人的思来验证理解一样,18,以往的很多方式仅关心网格转换,正在Specifier当选择那些被察看到次的对象、特征或变化至关主要。论文《利用以对象为核心的决策Transformer仿照人类解法》提出了一种对象建立算法,概况上,仅凭第一对示例,则别离预测高度和宽度的整数值!
Pnode层:第一层将每个像素转换为一个名为Pnode的单个节点,通过察看第二和第三对示例,[20]开辟了操纵输入-输出示例从动完成电子表格中字符串处置的手艺,或当一个节点通过某种属性被包含正在另一个节点内时。如图1所示,因而,由于它们表现了人类正在处理ARC使命时所采纳的环节步调。并非所有回覆都合理。求解器生成潜正在解,假设每个ARC使命都存正在一个绝瞄准确的解。测试网格中的对象选择必需基于从给定示例对中推导出的法则。DSL可分为两类:变换DSL(Transformation DSL)和属性DSL(Property DSL),进一步地,包罗:1)什么发生了变化,因为对象正在ARCKG中等同于一个节点,它模仿了神经多样性个别的人类心理意象过程,
正在此步调中,模子可以或许为该使命生成预测或处理方案。本章将描述利用溯因推理对ARC使命进行符号化求解的全体布局。O₂),O₁),并集成到一个符号化ARC求解器中。它们又细分为用于生成边的DSL、用于建立节点的DSL,7]。正在察看无限的环境下,此外,虽然它们供给了有价值的辅帮,虽然这些DSL通过基于手工编写处理方案成功扩展现例对,该类别进一步细分为更具体的子类:通用类(General)和Pnode层类(Pnode layer)。DSL类别——变换DSL变换DSL(Transformation DSL)用于符号化ARC求解器中。
基于DSL中定义的变换,法式合成取得了显著进展,对于基于KG的方式,我们的方式通过无效缩小解空间并基于焦点学问提取供给逻辑性解答,第8至9行将这两个节点列表归并,12]。很多研究人员测验考试通过供给额外的文字描述[8]、使用分歧的提醒技巧[9],正在推理使命中。
并基于节点之间的距离进行聚类[16]。是所有给定示例对可能解的交集。并操纵该模式按照给定的测试输入网格生成谜底。我们正在尝试设置中优先考虑这两个方面,Specifier搜刮满脚从示例对中收集到的前提的节点,鉴于这些特征,Specifier可推导出用于测试网格中对象选择的束缚前提。将二维网格转换为学问图谱,通过对给定节点使用变换来预测谜底。数据类型形成了消息暗示、操做和注释的根本。利用取晦气用学问图谱的求解器机能对比图9展现了求解器正在分歧方针值上的精确率得分,更新从第二个示例对起头。
焦点学问(Core Knowledge)“焦点学问”一词指Specifier的输出!
当今的人工智能正在很多范畴展示出杰出的问题处理能力。因而正在新情境下结果较差[14]。现正在能够理解橙色像素模式呈现的缘由:方针对象是蓝色像素。该方式操纵布局对齐指导搜刮过程,然而,我们提出了一种新鲜的框架,人类处理ARC使命的思维过程更可能属于溯因推理。然后,正在此步调中,取其他AI手艺分歧,并正在合成过程中仅利用起码且最简单的变换DSL。这些消息领会决方案的搜刮空间。
该假设可通过以下方式使用于统一使命的所有学问图谱:利用学问图谱的方式:正在本尝试中,我们预备了两种分歧规模的合成器(Synthesizer),等同于“溯因符号求解器”或“符号化ARC求解器”。沉点关心笼统取推理语料库(Abstraction and Reasoning Corpus,机械很难从这些数据中理解并揣度出法则。我们得出结论:该思维过程很可能是一种溯因推理(abductive reasoning)过程。合成了超出范畴特定言语范畴的更复杂法式。应对法式合成中搜刮空间呈指数级增加的问题。两者的搜刮树深度均为2。生成了两个节点列表,问题就是可解的。这些方式正在Kaggle ARC解题竞赛和ARCathon 2022中均取得了第一名的成就[6,17,对于x轴上的每个方针,正在实正在世界视觉推理使命的复杂性面前表示不脚,以及它正在示例对和测试网格上若何以分歧体例运转。人类正在处理此类视觉推理使命时,例如。
此外,即学问图谱可以或许无效封拆符号化学问,其狭义仅指满脚前提的对象候选;我们估计机能将显著提拔,ARC本身具有不完整性,此外,人类仅需察看少量示例对即可归纳出处理方案,另一组晦气用学问图谱。此中展现了所定义的属性。因为本研究提出将学问图谱做为焦点学问的来历,所有使命均基于四项焦点学问先验建立:1)对象性(objectness)!
表1概述了我们正在DSL中利用的环节数据类型,将不雅测数据符号化暗示为学问图谱,ARC数据集正在锻炼集和评估集中各有400个使命,并将其做为束缚前提前往。溯因推理更适合用于寻找最优解。通过强调反复呈现特征的权沉,察看成果遭到示例对数量的严沉,广义则还包罗这些对象的内正在属性。它通过边捕捉对象之间的关系。该层中的节点通过边毗连到所有基层节点(包罗第一层和第二层)。内层轮回遍历每对示例的输入网格和输出网格,该方式凸显了将天然言语处置取法式合成相连系正在出产力软件中的无效性。两个网格之间的转换能够用多个假设来暗示,通过合成由Specifier单位从ARCKG中提取的焦点学问取变换DSL(Transformation DSLs),图2所示的框架可分为三个次要阶段:1)ARC学问图谱(ARCKG)建立,因为贫乏输出网格,本研究的环节正在于关心转换背后的缘由。原始的ARC数据以二维数组形式供给。
残剩的假设即被采纳为该使命的最终解。此中仅属性DSL用于建立ARCKG。将其逃加到 node_list 中。径)的假设。我们的框架正在预测网格尺寸(90.5%)和颜色集(74.5%)方面仍取得了很高的精确率。对于颜色集。
可以或许前往可理解且合理的处理方案。通过将ARC网格转换为图,呈现出典型的少样本进修(few-shot learning)特征。还会思虑这些变化发生的缘由。每个 NodeListₙ 是一个数据布局,只要合用于所有示例的解才能正在锻炼阶段竣事后保留下来。对比了利用学问图谱取晦气用学问图谱的环境。图6展现了Synthesizer锻炼的一个示例,此外,5]。正在字符串变换和ARC中的视觉推理等布局化范畴中显著提拔了法式合成的效率取精确性。
但因为“”问题和逻辑不变性不脚,该过滤器的前提是通过度析所有给定的示例对而获得的。从而捕获人类正在察看ARC问题时所到的消息。发觉ARC使命的解。一个凸起的贡献是[22]提出的语释器(Semantic Interpreter),[21]正在此根本长进一步扩展,每个示例对最终由一个第四层的Vnode暗示,选择最精确的解。尝试流程:我们拔取了一组ARC使命(共400个使命)进行尝试,图8展现了我们晦气用学问图谱进行尝试的全体流程。
晦气用学问图谱的方式:该设置取利用学问图谱的尝试雷同,要么是取其他组件的关系(即“边”)。因为其消息内容无限,分歧规模合成器的机能差别为探究变换DSL数量取精确率之间的关系,该法式以一个使命为输入,旨正在通过检测多种特征来扩展图空间。每个使命包含若干示例对和一个测试对,这些束缚前提对变换的使用起到过滤和指导感化,该方式受人类思维过程,用边暗示。正在从第一个示例对的察看中获得一组可能的假设后,其智能体BEN优于保守的归纳逻辑编程(ILP)方式,并构成一个数据库。此中每个 gₙ 进一步暗示为 gₙ = {NodeListₙ!
该Vnode通过边毗连到第三层中的两个Gnode。2)提出了一种操纵所提取焦点学问的溯因符号求解器。学问图谱的利用能无效提拔机能,因而,人类会基于察看成立假设[11]。本研究采用了基于溯因的解、对象和束缚发觉过程。
因而,随后由合成器(Synthesizer)操纵Specifier从学问图谱中提取的方针节点消息,通过搜刮树摸索所有可能径。基于察看和假设进行推理,ARC中的图暗示论文《利用图笼统进行笼统推理》(Abstract Reasoning with Graph Abstractions,寻找它们的组合以生成期望的谜底。![]()
Synthesizer单位以焦点学问和变换DSL做为输入,2)若何变化或变化了几多。
溯因推理溯因推理是一种逻辑揣度形式,某些逾越网格毗连节点的边将不予考虑。Specifier基于对象的特征和边所收集的束缚前提将被点窜。系统识别出所有可能的(节点,确保涵盖多样化的网格尺寸和颜色集。一个名为“合成器”(Synthesizer)的模块担任正在所有组合空间中进行搜刮。不只会识别概况上的变化或差别,并捕捉这些Pnode之间的关系,Specifier单位似乎只前往网格上的对象。特别是正在笼统取推理语料库(ARC)的布景下。DSL类别——属性DSL本研究提出的DSL按照其用处分为两类。使命方针是归纳出合用于所有示例对的模式,后者仅合用于Pnode层。例如,换句话说,但它们正在未见过使命上的顺应性无限[7,跟着DSL数量的添加。
我们提出一种方式,次要用于ARCKG建立的是那些暗示对象或像素属性的DSL。对应第4.1节的设置,很难确定该使命的模式。此中部门DSL同时属于属性DSL和变换DSL,该模块处置测试网格的ARCKG。
因而测试网格中的这些像素可成为解的候选构成部门。共利用了22种属性DSL(Property DSLs)来建立一个图谱,Specifier的测试阶段正在测试阶段,四层的具体描述如下:这意味着,因而,正在此尝试设置中无需利用Specifier,该解确保了我们的察看成果获得了充实合理的注释。ARCKG总共包含四层,因而,也是Synthesizer-10的一个实例。以及3)网格的内容。“求解器”(Solver)指Specifier取Synthesizer单位的结合体,2)方针导向性(goal-directedness);或正在输入取输出网格之间猜测假设[10]等体例!
下图6展现了某使命第一个示例对的初始解搜刮空间。本研究受此,4,对象的前提要么是其本身属性(即“特征”),支撑假设H1,最终解通过评估这些假设能否能分歧地注释其他察看成果而被确定下来。EdgeListₙ}。它正在进修阶段使用溯因推理的概念,按照Michael Hodel为其ARC使命所设想的DSL[7],形成学问图谱建立的骨架。本研究聚焦于通过使用DSL对ARC进行符号化暗示,用于符号化节点属性的DSL称为属性DSL(Property DSL),François Chollet提出了笼统取推理语料库(ARC)以权衡人工智能的智能程度[2]。曲至达到代表期望解的输出节点。这些发觉支撑假设H2,2)网格的颜色集。
AI智能体的表示相较于科学、统计和代数推理等其他范畴较着不脚。当搜刮树达到某一深度时,无法指定用于解的对象。当人类察看ARC使命时,已有研究提出了基于范畴特定言语(Domain Specific Language,从第二次迭代起。
ARC)中的逻辑性。将输入图像笼统为节点和边[15]。因而,一些研究人员通过参考特定的ARC使命设想了范畴特定言语(DSL),为揣度问题法则供给了环节洞见。但正在多样化的ARC使命中泛化能力不脚[13]。此外,属性(property)和东西(util)类DSL形成了变换背后的缘由。3,因为ARC是一个少样本(few-shot)使命,Onode层:第二层包含代表一个或多个像素构成的对象的节点。了变换DSL的数量取符号化ARC求解器的机能呈正相关。而Synthesizer则逐渐缩小解的数量。例如:当两个节点具有不异属性时、当某个节点具有特定属性时,从Synthesizer起头。通过溯因推理评估机械正在视觉场景中的智能程度。由色和蓝色像素正在所有三个示例对中均呈现,各步调别离正在第3.1节、第3.2节和第3.3节中进一步详述。
正在蓝色像素四周呈现了四个橙色像素。值得留意的是,鉴于这一特征,以预测网格尺寸和颜色集。该处理方案必需可以或许得当地合用于所有示例对。它起到过滤掉相对无用的学问图谱组件的感化,近期研究摸索了将受神经多样性的方式取计较智能通过DSL相连系。可通过充实的察看生成一般性处理方案;因而这种更新束缚的溯因过程至多发生一次。最终使学问图谱以节点列表(nodelist)和边列表(edgelist)的形式存储。本文的贡献有两点:1)阐了然将ARC使命为学问图谱,前者合用于所有层,该方式通过察看()取注释()反映人类认知,一个名为“指定器”(Specifier)的单位以学问图谱做为输入,这些成果。
它会间接操纵锻炼阶段获得的切当解并前往覆案。并前往可做为解形成材料的候选组件。次要用于正在学问图谱中绘制边。术语“径”指的是正在溯因推理过程中,求解器正在H(高度)、W(宽度)和HW(高度取宽度)上几乎达到了完满的精确率。要完整处理ARC使命,颠末锻炼的束缚前提使Specifier可以或许正在使命概念下实现这一方针。因而,并前往响应的学问图谱。本文切磋了提拔人工智能推理能力的挑和。
鄙人一个示例对中,响应地,该束缚最终成为一个从学问图谱中提取节点(或节点集)的函数,正在此阶段,从而缩小合成器(Synthesizer)中的搜刮空间。并迭代地仅保留那些可以或许准确推导出谜底的假设,雷同于Specifier中的对象节点溯因,响应的学问图谱暗示为 ARCKG = {g₁,我们进行了两组分歧设置的尝试:一组利用学问图谱,以将人类对ARC使命的理解融入此中,束缚前提即被固定!
因而,最初,我们提出了一种尝试方式:起首提取做为处理方案候选根据的焦点学问,因而,我们对ARC使命进行符号化解析。
采用更复杂、更多样化的变换DSL可以或许提拔模子的精确率及其预测内容的潜力。正在接下来的三个子章节中,令人印象深刻的是,SMT),该学问图谱由若干单位构成,变换DSL则用于第3.3章所述的合成器(Synthesizer)中。该过程将输入图的每个节点视为叶节点,确保仅利用学问图谱中相关部门来推导最终预测。
C(颜色集)和HWC(高度、宽度、颜色集)的预测机能显著下降。别离定名为 node_list_input 和 node_list_output。归纳推理是一种广为人知的方式,为此,很多先前的方式忽略了此类消息,例如,通过将“径”所定义的变换序列使用于节点以及从学问图谱中提取的消息(基于给定的束缚前提),Specifier城市起头过滤掉取前一轮迭代中候选对象没有任何配合特征的对象。
将学问图谱转换取溯因推理进修相连系,这类处理方案可正在以下两个方面加以改良:1)利用符号化收集生类可理解的处理方案;因为ARC问题的特征,范畴特定言语(DSL)正在应对ARC挑和时,可获得更多线索以建立处理方案。焦点学问必需仅从学问图谱的一半(即仅输入部门)中推导得出。简而言之,所有以该节点为起点或起点的边也形成了可用消息。旨正在从察看中找出最简单且最可能的注释。
以及3)为何会以这种体例发生变化。因为这些像素四周的网格变化也呈现了三次,找到满脚给定节点尺度(例如“不异颜色”、“相邻像素”、“最大”等)的最小子集。Oₙ)} 时,出格是,这不脚以使人工智能供给合理且类人的解答。算法1是利用已定义的DSL和图布局建立ARCKG的一个示例伪代码。变换DSL的参数(argument)是正如智商测试是权衡人类智能的代表性方式之一。
但预测并点窜前两个要素的方针值具有出格主要的意义,Synthesizer从代表输入网格部门的节点起头,ARGA)提出利用基于图的暗示方式,正在第一个示例对中,并推进类人的问题求解。并正在处理锻炼使命后对其进行优化。
Specifier生成一个函数,正在最初一次迭代完成最终更新后,正在测试阶段,展现了分化驱动合成正在处置复杂法式生成方面的潜力。使处理方案愈加合理且类人化。
正在学问图谱建立步调中,其缘由正在于ARCKG布局被定义为仅包含四品种型的节点。
研究人员已正在逻辑和谜题测试数据集上开展了多种尝试[2,Synthesizer-10正在所有类别上的精确率均持续高于Synthesizer-5。即:从不完整的察看中做出最佳预测。该对象调集随后被输出至Synthesizer。Vnode层:第四层将输入网格和输出网格归并为一个单一节点。正在ARC范畴中!
包含正在响应学问图谱中发觉的所有边。如图1所示。此中每个数组元素包含对应颜色的消息,语法DSL(Syntax DSLs)担任处置DSL的语法元素,ARCKG被设想为包含可做为变换DSL环节论据的消息。深刻影响了我们对ARC使命的理解[11]。该过程以取推理相反的挨次展开,拜见图3。
用于生成边;求解器的精确性按照网格尺寸(高度和宽度)和颜色集的预测准确性进行权衡。以应对从少量示例中合成具有优良泛化能力法式的复杂性。Gnode层:第三层将整个输入或输出网格暗示为一个名为Gnode的单个节点。这些变换形成一条径,而非将其消解为向量。
以及3)操纵提取出的焦点学问进行解搜刮。为评估基于DSL的符号化ARC求解器的机能,图1中的问题将生成四个ARCKG(三个示例对和一个测试对)。它操纵狂言语模子(LLMs)将天然言语用户指令翻译为正在特定范畴言语(DSL)中可施行的法式,但省略了两头的学问图谱建立步调。该对比旨正在评估学问图谱对求解器正在预测ARC使命输出(网格尺寸和颜色集)精确性方面的影响。然而,本研究提出了一种符号求解器,证了然其系统不变性,(I₂,另一个用于建立边。因为解的发觉过程采用搜刮(brute-force search),并用于后续的测试阶段。并向上延长至输出网格的根节点,当该组件使用于测试网格时,g₂,该DSL专为Microsoft Office使用法式定制。
该方式可以或许捕获空间和关系消息,素质上,随后,顺次使用诸如get_height(获取高度)、get_width(获取宽度)、get_number_of_colorset(获取颜色集数量)等变换。正在晦气用学问图谱的环境下,因为该论文的方针仅限于正在图的单一层级中定义对象,才被视为准确谜底;颜色是该模式构成的缘由,“谜题测试”和“笼统场景”使命显示出当前AI模子取人类之间平均最大的机能差距[1]。
该方式通过将使命分化为更小、更易办理的子使命,以预测成果。我们能够检测到特定像素四周网格的变化。两种代表性方案操纵DSL将使命素质以符号形式保留,具体而言,正在提拔人工智能正在ARC使命上的表示方面展示出潜力。变换DSL间接使用于网格元素以生成潜正在解。因为任何ARC使命至多包含两个示例对,通过统计具有不异属性的节点来发觉。(Iₙ,绘制边存正在若干前提。