当前位置: 首页 >> 江湖论坛 >> 江湖论坛
小论世界围棋等级分(转 )
作者:wqjh   日期:2016-10-07
作者:不会功夫的潘达
链接:https://zhuanlan.zhihu.com/p/21356678
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

伴随着阿尔法围棋-李世乭的五番棋大战,一个名为“goratings”的等级分进入大众视野。到目前为止,围棋界并未有官方的世界等级分。因此,出于比较阿尔法围棋与各路人类高手强弱的需要——以及网络媒体吸引眼球的刚需,goratings等级分在各大网络媒体上广为流传。随之而来的则是不止的争议:“阿尔法狗一共只下了十盘棋,排在第二位真的科学吗?” 本文将简单梳理一下网络上对围棋等级分的相关疑问,以及将goratings等级分批判一番。本文看上去很长,不过多为引用列举的数据,第一遍阅读时可以跳过。一、ELO等级分ELO等级分制度是指由匈牙利裔美国物理学家Arpad Elo创建的一个衡量各类对弈活动水平的评价方法,是当今对弈水平评估的公认的权威方法。被广泛用于国际象棋、围棋、足球、篮球等运动。网络游戏英雄联盟、魔兽世界内的竞技对战系统也采用此分级制度。——维基百科——维基百科具体的公式不重要。我们只需要知道,我们可以依据两名棋手的ELO等级分推断他们之间的对战胜率期望。 以下以nmcgw版等级分为例。去年年末,梦百合杯决赛前,柯洁的等级分是2820分,李世乭等级分是2678分。代入公式,得到柯洁对李世乭的(单局)胜率是69%。取K=16,柯洁胜李世乭一盘得5分,败则扣11分。相应地,李世乭赢一盘得11分,输一盘扣5分。可以看出,战胜强手可以得到大量的分数,而败于强手扣分不多,反之亦然。如果样本足够大,那么ELO等级分就能忠实地反应棋手的实力。二、中国棋院等级分中国棋院等级分采用的就是ELO体系。这是中国棋院公布的2016年5月末的等级分(部分)。其实资深棋迷扫一眼此图就能发现棋院版等级分的问题:过去一年正式对局数不超过十局的孔杰,仍然高居第33位。情况相似的还有位于第61位的俞斌。按照一般的标准,这两位棋手应该被列入不活跃棋手名单。这只是棋院版等级分问题的冰山一角。我们知道,计入等级分的对局不止有国内比赛,还有国际比赛。那么非中国籍棋手的等级分怎么办呢?国家体发(委)从1995年1月1日起试行围棋等级分制,具体细则摘要如下:一、 在围棋等级分启动阶段,原则上按棋手一次性确定各自的等级分。具体标准为:九段2560分、八段2520分、七段2480分、六段2440分、五段2400分、四段2360分、三段2320分、二段2280分、初段2240分。二、经过计算确定的棋手等级分,由国家体委列表于每年1月1日和7月1日各公布一次。必要时可适当增加公布次数。三、外国棋手参考等级分:2600分:小林光一、赵治勋、武宫正树、林海峰、藤泽秀行、大竹英雄、加藤正夫、曹薰铉、徐奉洙、李昌镐、刘昌赫。2560分:日本、韩国现有九段;小松英树。2520分:日本、韩国现有八段;富士通杯、东洋证券杯、真路杯、亚洲杯、中日擂台赛、中韩对抗赛、中韩新锐对抗赛等赛事出场的五段以上的棋手。外国棋手的参考等级分仅供国内使用,与国内棋手的等级分同时公布。这是以前的制度,也就是赋予其他对手一个参考分数。不知道什么时候,中国棋院等级分里的外国棋手分数也开始了相应的动态变化,这样就科学了很多。三、nmcgw版等级分相传,中国棋院等级分是由一人手动录入到excel里算出来的。事实上,每个月公布的公示版等级分与正式分数总是有几盘棋的差异(统计遗漏),这似乎证实了上述传言。由于日本棋院和韩国棋院都将棋手的对局记录及时公布在官方网站上,统计等级分自然不成问题。然而中国棋院......似乎没有考虑过公示对局记录——这是一个被批评了不知道多少年的问题。在2016年,这样的工作,对于一个拥有两千万爱好者,数百名注册职业棋手的运动的组织,本应是天经地义的事情,然而中国棋院始终没有做好。中国棋院坚持以内行领导内行,本是好事。只是,老棋手在某些方面的思维似乎跟不上这个时代。不过,如果有人有足够的耐心,手动统计所有的正式对局,那么在中国棋院等级分的基础上,计算出世界等级分也并非难事。这就是nmcgw版等级分。nmcgw版等级分始于2011年1月,初始等级分采用中国棋院版当月的等级分。其他设定包括:1.统计一切公开成绩的赛事,原则是只要对局双方有争胜负的动力,对局的结果就能反应双方的相应实力。因此像野狐道场内部训练赛之类的赛事也计入本版等级分。2.一年对局大于或等于12局的棋手方参与排名。3.新初段的等级分一般设为2240分,除非是活跃的有等级分业余棋手入段,则继承之前的分数。原贴由于tom棋友论坛改版,已经丢失。2013年-2014年的数据在九歌论坛的相应帖子,2015年1月以后的数据在tom论坛的新贴。 ÊÀ½çΧÆåÖ°ÒµÆåÊֵȼ¶·ÖÅÅÐаñ£¨nmcgw°æ£©截止2016年6月12日,世界围棋职业棋手等级分前100名:排名 棋手 棋院 段位 等级分  增减  短期分 中期分 中期胜局 中期局数 中期胜率1  柯洁   中 9   2792   -18  2752  2816   89   111   802  朴廷桓  韩 9   2753    7  2710  2733   63   89   713  李世石  韩 9   2723    1  2731  2715   59   89   664  芈昱廷  中 9   2708   17  2781  2673   59   87   685  时越   中 9   2708    5  2657  2675   57   88   656  柁嘉熹  中 9   2686   -3  2740  2662   59   87   687  井山裕太 日 9   2685    3  2652  2756   43   51   848  金志锡  韩 9   2665   -7  2686  2614   54   84   649  朴永训  韩 9   2660   -2  2648  2689   47   66   7110 姜东润  韩 9   2658    0  2659  2654   44   67   6611 陈耀烨  中 9   2656   10  2605  2614   46   76   6112 周睿羊  中 9   2653    1  2602  2635   45   75   6013 唐韦星  中 9   2652   -7  2669  2637   56   91   6214 江维杰  中 9   2641   -2  2615  2611   43   70   6115 黄云嵩  中 5   2637    2  2592  2645   63   92   6816 连笑   中 7   2637   -3  2601  2604   46   77   6017 王檄   中 9   2632   -5  2687  2642   29   45   6418 彭立尧  中 5   2632   -12  2631  2598   49   79   6219 古力   中 9   2629   -2  2636  2616   39   73   5320 李东勋  韩 5   2626   -3  2668  2609   53   83   6421 申真谞  韩 5   2624    3  2668  2687   58   75   7722 辜梓豪  中 4   2624    7  2666  2643   67   93   7223 李钦诚  中 2   2624   18  2624  2605   56   92   6124 元晟溱  韩 9   2621    4  2728  2633   50   67   7525 檀啸   中 7   2607   -6  2508  2584   33   60   5526 范廷钰  中 9   2604   -2  2609  2577   39   68   5727 童梦成  中 5   2601   22  2643  2581   55   79   7028 范蕴若  中 4   2601   11  2594  2575   63   96   6629 崔哲瀚  韩 9   2596    4  2480  2574   40   66   6130 罗玄   韩 6   2594    7  2649  2551   35   60   58这是我认为,到目前为止,最为全面和科学的围棋等级分,出自一位棋迷之手。四、goratings等级分回到我们开头说的goratings等级分。goratings等级分采用WHR算法。Whole-History Rating (WHR) is a new method to estimate the time-varying strengths of players involved in paired comparisons. Like many variations of the Elo rating system, the whole-history approach is based on the dynamic Bradley-Terry model. But, instead of using incremental approximations, WHR directly computes the exact maximum a posteriori over the whole rating history of all players. This additional accuracy comes at a higher computational cost than traditional methods, but computation is still fast enough to be easily applied in real time to large-scale game servers (a new game is added in less than 0.001 second). Experiments demonstrate that, in comparison to Elo, Glicko, TrueSkill, and decayed-history algorithms, WHR produces better predictions.大意就是WHR算法是ELO算法的变种,但更加准确,能更好地反应棋手实力。理论上来说,WHR算法的效果和ELO算法应该差不多。实际情况如何呢?nmcgw对nmcgw版等级分和goratings等级分之间的差异做了统计,结果如下(截取部分):截止2016年5月31日,Go Ratings排行榜和本版对照棋手排名:RT排名  中文名  RT等级分 本版等级分 本版排名1   柯洁      3628   2810    12   朴廷桓     3576   2746    23   李世石     3544   2722    34   时越      3528   2703    45   芈昱廷     3519   2691    56   井山裕太    3519   2683    77   朴永训     3512   2662    98   金志锡     3511   2672    89   柁嘉熹     3503   2688    610  连笑      3497   2640    1611  周睿羊     3481   2651    1212  辜梓豪     3476   2617    2313  姜东润     3475   2659    1114  王檄      3475   2637    1715  陈耀烨     3467   2647    1316  唐韦星     3460   2660    1017  黄云嵩     3457   2635    1818  李钦诚     3455   2605    2619  江维杰     3450   2643    1520  李东勋     3450   2629    2021  古力      3450   2631    1922  彭立尧     3448   2644    1423  申真谞     3435   2622    2124  洪性志     3430   2561    4425  檀啸      3428   2613    2426  元晟溱     3424   2617    2227  崔哲瀚     3422   2592    2828  范廷钰     3416   2606    2529  古灵益     3407   2587    3430  谢尔豪     3404   2594    2731  范蕴若     3403   2590    3032  童梦成     3396   2579    3733  杨鼎新     3394   2580    3634  安成浚     3390   2588    3135  许映皓     3389   2546    4836  陶欣然     3389   2564    4337  李志贤     3386   2551    4638  孟泰龄     3383   2578    3839  邬光亚     3381   2591    2940  邱峻      3381   2533    5941  尹峻相     3380   2567    4242  金庭贤     3378   2549    4743  李轩豪     3376   2585    3544  李映九     3375   2574    4045  陈时映     3374   2514    8346  卞相壹     3374   2576    3947  睦镇硕     3371   2539    5448  郭闻潮     3371   2518    8049  赵汉乘     3369   2588    3250  罗玄      3368   2587    3351  金明训     3367   2493    9852  周贺玺     3362   2570    4153  胡耀宇     3362   2536    5754  孙腾宇     3359   2539    5355  杨楷文     3359   2526    6956  申旻埈     3356   2531    6157  李喆      3356   2533    5858  朴珉奎     3355   2501    9359  陶忻      3353   2468   11960  张立      3350   2491   10261  安国铉     3348   2544    4962  丁浩      3348   2459   12363  高尾绅路    3347   2521    7664  许家元     3347   2492    9965  山下敬吾    3345   2533    6066  李昌镐     3340   2492   10067  河野临     3340   2528    6768  王昊洋     3340   2522    7569  尹灿熙     3338   2502    9070  安冬旭     3338   2531    6271  姜儒泽     3338   2525    7272  蔡竞      3336   2518    7873  朴正祥     3336   2476   11174  韩尚勋     3335   2529    6575  陈贤      3332   2540    5276  白洪淅     3329   2537    5677  金升宰     3329   2526    7078  朴进率     3327   2497    9579  舒一笑     3327   2373   22280  孔杰      3327   2517    8181  党毅飞     3326   2542    5082  闵祥然     3324   2514    8483  廖行文     3324   2558    4584  朴文垚     3323   2539    5585  胡跃峰     3321   2501    9286  陈浩      3318   2420   16787  於之莹     3314   2435   15088  国宇征     3314   2492   10189  钟文靖     3313   2530    6390  余正麒     3310   2451   13391  谢赫      3310   2526    7192  金起用     3310   2508    8593  金显灿     3309   2504    8894  金世东     3309   2484   10895  一力辽     3308   2457   12596  张涛      3307   2524    7397  韩雄奎     3305   2456   12798  佟禹林     3305   2431   15899  周鹤洋     3303   2508    86100  刘星      3300   2527    68误差超过10名的棋手,已经手动用下划线标出。不比不知道,一比吓一跳。前九名非常和谐,但从第十名开始,两版之间就开始出现差距。第五十名以后的棋手,两版之间的排名差距更是大到夸张。差距来源于何处呢?我们以2016年5月31日,nmcgw排名51位,goratings排名126位的夏晨琨为例。根据nmcgw版等级分,夏晨琨中期对局记录(即过去一年内)是40胜25负。而查阅goratings等级分,夏晨琨同期对局记录为11胜21负。......怎么能差这么多?原来,goratings等级分的数据全部来源于http://go4go.net网站。由于该网站数据不全,特别是对于关注度不高的比赛缺乏记录,相应地,等级分在五十名之后的棋手,排名误差可以非常的大。像11胜21负和40胜25负这样的误差,足以说明goratings等级分不足以作为可靠的参考。五、世界等级分作为一项竞技,围棋有统一的世界等级分本应是自然的事。然而现实中,中韩日台三国四地棋院为了利益互相扯皮(看看中日韩台四个棋院四个不同规则的争议就可见一斑),统一等级分事实上遥遥无期。在此背景下,法国人Remi Coulum自创的goratings等级分渐为人熟知,并被媒体和民间接受。然而,goratings等级分由于数据严重缺失,事实上相当不可靠。反而是中国棋迷手动统计的nmcgw等级分更为可靠。未来,围棋世界想要自给自足,必然要进一步地职业化,摆脱现有的五花八门的不职业的制度细节。建立统一的等级分体系势在必行。除了ELO或类ELO体系的等级分以外,另一种思路是类似网球的积分体系,以各赛事排名为依据计算积分。@高飞龙 在中国围棋究竟整体在国际上处于什么样的水平和地位? - 高飞龙的回答 答案中采用的就是这样的思路。这当然也是可行的,只是围棋世界赛事正赛名额有限,这样的排名若正式化,恐怕对上升期的新棋手并不友好。无论如何,中国棋院都应当正视等级分中存在的问题,进一步改进中国棋院版等级分,并及时公布所有职业对局记录。这是为了世界等级分的建立做准备。要知道,韩国棋院的裴太一博士已经发布他的世界等级分有很多年了。如果毫无作为,中国棋院将来在世界等级分的协调上恐怕会失去话语权。
返 回
 
发表评论: 发表评论内容请控制在500字以内
 
发贴须知:
1.严禁灌水,杜绝一切无聊话语,禁止发表国家明令禁止的言论。
2.欢迎大家举报相关不良信息。


围棋江湖网 联系方式   Email: wqjh2013@163.com
Copyright @ 2013 围棋江湖 All Rights Reserved   晋ICP备13004281号