`

足坛大数据-数据的应用和重要性

2017/10/15 1:28:53 sports8.net 互联网

在NBA的时候,经常看到一项技术统计,叫做球员效率指数,具体算法是这样的以下转自某度:

“效率指数=[(得分数+助攻数+总篮板数+抢断数+盖帽数)-(投篮出手数-投篮命中数)-(罚球出手数-罚球命中数)-失误数]/球员的比赛场次。这个依据的得出,可以综合判断球员良性表现,并且参照球员的球场不良表现,接着根据球员出场的次数来得出单场平均的效率表现。”

   公式初看比较复杂,其实换句话来讲就比较容易理解,如果把比赛比作考试的话,假如考试有100道题,你做对了80道题,你的效率指数就是80%。篮球比赛当中你要有运球、传球、投篮、防守、篮板等,你每做对一个动作就相当于答对一道题,每次投篮不中或者传球失误就相当于做错一道题。效率指数就是类似于一个综合打分系统,来相对客观的给球员做出评价。下面来看一下某度的NBA效率指数排名


   该排名的具体年份不详,但里面唯一值得注意的是科比。科比仅排在第10位,这比一般人预期要低很多,我个人觉得科比至少应该进前五。我想科比效率排名低的原因,主要是因为科比虽然得分很高,但是出手次数太多,导致的效率指数太低。 我在这里并不是要黑科比,只是想探求效率指数的实际作用。

   那么问题来了,既然篮球可以有效率指数,足球为什么就不能有呢?如果足球也能有效率指数的话,是不是也可以找到那些进球虽然很多,但是把握机会能力很差的浪射帝?是否可以通过数据发现未来之星?是否可以找到球队的黑洞?然后,我上网搜索了很长时间,也没有发现有关于足球的效率指数方面的数据。既然没有,我想可不可以设计一个足球方面的数据统计公式呢?有了这个想法之后,我经过无数次的试验,终于设计了一个适合于足球这项运动的统计公式。(为了保证文章的可读性,公式列在文章最后)

   有了算法以后,更重要的是用比赛来检验,可是用哪国的联赛来检验最合适呢?这期间我也走了很多弯路,最后的最后我选择了中超,因为中超的球员我认识的也比较多,做数据统计比较方便。但更重要的原因让我选择中超,是因为乐视体育有中超所有场次的免费的比赛录像,相比较其他联赛,更容易获得数据。但由于楼主本人时间实在有限,仅统计了一部分的比赛数据,并根据公式,生成了以下几张统计表。



再次说明,这是我抽着看的录像所统计的数据,而且把重庆力帆给忘了,实在对不起重庆球迷。这个统计结果肯定有些片面,但我想至少在一定程度上,提供了相对客观的球员评价方式。假如我的数据够多的话,能达到全面240场数据,那么这张统计表将有更重要的意义。

   根据球员表现可以汇总得出球队的整体效率表现


   这张图中我们看到效率排名与联赛实际排名差别最大的是山东鲁能,效率第5而联赛排名仅第14,说明山东肯定是个强队,但肯定是内部出了某些原因,导致就是赢不了球,哪位大神有内幕消息,可以帮我解答一下。再江苏和延边两只球队,效率排名很低,但实际联赛排名却很高,我分析是这两只球队主要是以防反为主,以牺牲传球成功率的方式,打快速反击,因此才导致传球成功率低,但一旦把握住机会,就会给对手致命一击。

我觉得效率统计表有可能还有以下用处:

一是我想可以为高洪波的国家队选员,提供数据支持。而且假如有亚洲其他联赛球员的数据的话,高指导是不是可以更有针对性的排兵布阵。如果按照我的效率排名来确定中国12强赛的首发的话,我理想中应该是这样的


   重要事情说三遍,个人精力有限,得出的数据也比较片面。我的公式当初设计的时候,没有考虑门将,如果哪位大神有比较合理的方法的话,请赐教。

   二是我觉得利用效率排名,可以为球队转会新援提供依据。比如可以发现出哪些球员有潜力值得投资;哪些球员表面上动作花哨,而实际作用很差;风格相近的队员比如布斯克茨和克罗斯,只能买一个的话应该买谁;伊斯科和J罗到底谁更应该被甩卖等等。

   三是为足彩提供数据支持,甚至可以更科学的预测比赛结果

   四是我的这种方法最不济也能提供给大家一个更科学合理的撕逼渠道,像什么我罗强于某西几条街,西甲就是没有英超好等等。

   在大数据的时代,体育运动也可以根据数据来找出内部的运动规律,关键是如何获取数据、利用数据。还是那句话,我个人时间精力能力都有限,无法统计所有的数据。但一般人统计一场比赛的数据,可能要3天左右的时间。用我的方法,只要会excel就可以,统计一场比赛的时间只要不到2个小时左右,甚至可以做到与直播同步出数据并且全场比赛可以统计100项、1200多个数据。

   在这里,我想招募几个和我一样,对足球比赛数据有兴趣的朋友,大家一起来做。这样的话,平均到每人,一人一周只要不到两个小时时间进行统计,几个人汇总之后,就可以获得中超全年所有队员的数据。和若有愿意和我共同发掘中超数据“宝藏”的朋友,我会给您分享我的数据统计的经验,如果有兴趣的朋友给我留言吧!!!

附录:关于这篇文章的权重计算公式

我把足球场上的动作分为5大类,并且每个技术动作又分成:灾难(-4)、较差(-3)、一般(1)、漂亮(2)、有威胁的(3)、神级(4)六个等级,括号中的数字为每个等级又对应了不同的权重分值,

   具体计算公式为:球员效率=球员得分/球员总触球次数

   其中:球员得分=射门得分+传球得分+放手得分+盘带得分+头球得分

   以射门为例:射门得分=神级次数×4+威胁级次数×3+漂亮级次数×2+一般级次数×1-较差级次数×1-灾难级次数×2

   具体数字举例,假如武磊一场比赛当中有1次神级射门,2次威胁级射门,2次漂亮级射门,3次一般射门,1次垃圾射门,1次灾难级射门。那么武磊本场比赛的射门得分=1×4+2×3+2×2+1×3-1×-1×2=11分

   总触球次数=射门次数+传球次数+防守次数+头球次数+盘带次数

具体数字举例,假如武磊一场的总触球次数为80次,比赛当中的射门得分11,传球得分40,防守得分5,头球得分3,盘带得分20。那么,武磊的总效率为:

总效率=总得分/总触球次数=(11+40+5+3+20)/80=98.75%

   这个公式的关键就在于,如何把每个技术动作归到响应的等级当中去,这需要数据统计者有大量的阅读比赛的经验。


文章来源:soccercode



也许您还喜欢:世界杯直播  亚洲杯直播  欧洲杯直播  足球直播

返回体育新闻首页>>

上一篇:  状态复苏,J罗vs兰斯精彩个人集锦


下一篇:  旧将:曼联还得继续引援


百度搜索:足坛大数据-数据的应用和重要性

360搜索:足坛大数据-数据的应用和重要性

搜狗搜索:足坛大数据-数据的应用和重要性