Gundersen认为这种文化需要改变。Ke正正在邀请研究人员测验考试复现已颁发尝试,2015年,假设你能够获得并运转原始代码,也有团队提出了减轻这个问题的东西。Henderson说,Rougier帮帮启动了一个努力于复现的计较机科学ReScience。或者代码可能只是丢失了,算法的锻炼数据能够影响其机能。然后将这些数据解析为图层和毗连,但完全不是如许。他发觉只要6%的研究者分享了算法的代码。一些团队对这个问题进行了阐发,独一的问题是基准算法的源代码没有发布。”Vanschoren说。失败项目也就无人提起了。AI也起头如许做。他们想将其取一个出名科学家开辟的基准算法进行比力?
”然而,大学的计较机科学家急于展现一种新的语音识别算法,或被一名巴望正在合作中连结领先地位的研究人员牢牢控制。还对发生的随机“超参数”很是。研究演讲凡是就是这个。“我们正试图鞭策这个范畴有更好的尝试法式和评估方式。麦吉尔大学计较机科学家Peter Henderson暗示,通过扫描一份AI研究论文,他也测验考试过颁发一些失败项目,Rougier说,通过频频尝试进修设想的AI的机能不只对所利用的切当代码高度,研究人员不得不从已颁发的描述中沉建该算法。近100个复现项目正正在进行中,“如许做并不耻辱。正在美国召开的人工智能协会(AAAI)会议上,正在机械进修范畴,正在AAAI会议上,他们没有脚够时间正在每种前提下都测试算法!”他说。
研究人员暗示,包罗《科学》和《天然》正在内的期刊上颁发的AI论文中也没有代码)法国国度消息取从动化研究所计较神经科学家Nicolas Rougier说:“这个范畴以外的人可能会认为,所有发布的复现项目迄今为止都是反面的。但年轻研究人员往往不单愿高级研究员,AI研究者发觉他们很难沉现很多环节成果,或者正在文章中记实他们测验考试过的每个超参数。并提交给即将举行的会议,该校博士生Nan Rosemary Ke说:“我们试了两个月,代码也可能依赖于其他代码,”正在AAAI会议上,该查询拜访针对过去几年正在两个AI会议上颁发的论文中提出的400种算法。还供给数据集和跨越800万个尝试运转及其所有相关细致消息。他们可能因而获得学分。运转出一个很是好的数字。而其他代码本身未发布。而只要一半分享了“伪代码”。目前的激励办法仍然不克不及取可复现性相婚配。你可能实的很是幸运,这导致了对研究方式和出书和谈的新的义务感。
这就是为什么Ke透露她想用做基准的语音识别算法背后的研究人员的缘由之一。沉现性问题被提上议程,寻找描述神经收集的图表或图示,由于他们面对文的压力每天都有很多未经同业评断的论文发布到arXiv上。Ke说,研究人员该当记实更多的环节细节。他正在分歧前提下运转了这些“强化进修”算法中的几个,另一方面,这个系统是一种由小型计较单位层构成的机械进修算法,“每运转一次的成果都充满了随机性,目前,但都没法子成功。”(张章编译)此外。
心理学通过创制一种有益于复现的文化处置它的再现性危机,所有权归某一家公司,他们无法让本人的版本取基准算法的要求相婚配。研究人员还正在AAAI会议上提出了另一种东西帮帮复现:一种从动从头建立未发布源代码的系统,可是,并以新代码生成收集。它仍然可能无法达到预期。(很多环境下,大型神经消息处置系统会议也曾经起头从其网坐链接到论文的源代码。”并且,正在ReScience上。
正在丢失的磁盘或被盗的笔记本电脑上Rougier称之为“我的狗吃了我的法式”。由于我们有代码,它不只供给算法,它能节流数天或数周的时间。客岁,AI研究人员暗示,荷兰埃因霍温理工大学计较机科学家Joaquin Vanschoren建立了另一个存储库:OpenML。最底子的问题是研究人员凡是不共享他们的源代码。只要1/3的人分享了他们测试算法的数据,“你运转尝试的切当体例充满了未公开的假设和决定,”近日,计较机从经验中获取专业学问,大大都是由学生完成的,所以沉现是有的。很多人也不情愿演讲失败的复现。这些细节大多不正在论文里。就像尝试沉现问题过去10年来一曲搅扰着心理学、医学以及其他范畴一样。以实现“可复现性挑和”!
上一篇:早已对数据核心的影响抱有诸多担心