2021年“高教社杯”全国大学生数学建模竞赛ABC题的分析:
A题疫苗生产问题思路。
第一问确定答案,其他题思路新冠肺炎肆虐全球,给世界带来了深重的灾难。各国为控制疫情纷纷研发新冠疫苗。假定疫苗生产需要经过CJ1工位、CJ2工位、CJ3工位以及 CJ4工位等4个工艺流程。
每个工艺流程一次性均能处理100剂疫苗,这100剂疫苗装进一个加工箱一起送进工位的设备进行处理。而且,只有按照CJ1-CJ2-CJ3-CJ4的顺序在4个工位都进行了加工以后,才算完成生产。
为防止疫苗包装出现混乱,某疫苗生产公司生产部门规定,每个工位不能同时生产不同类型的疫苗,疫苗生产不允许插队。
即进入第一个工位安排的每类疫苗的生产顺序一旦确定就要一直保持不变,而且前一种类型的疫苗离开某个工位后,后一种类型的疫苗才能进入这个工位。
B题消防救援问题赛题思路。
赛题描述
随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援队承担的任务也呈现多样化、复杂化的趋势。对于每一起出警事件,消防救援队都会对其进行详细的记录。
问题1:
将每天分为三个时间段(0:00-8:00为时段Ⅰ,8:00-16:00为时段Ⅱ,16:00-24:00为时段Ⅲ),每个时间段安排不少于5人值班。
假设消防队每天有30人可安排值班,请根据附件数据,建立数学模型确定消防队在每年2月、5月、8月、11月中第一天的三个时间段各应安排多少人值班。
问题2:
以该地2016年1月1日至2019年12月31日的数据为基础,以月份为单位,建立消防救援出警次数的预测模型。
以2020年1月1日至2020年12月31日的数据作为模型的验证数据集,评价模型的准确性和稳定性,并对2021年各月份的消防救援出警次数进行预测。
问题3:
依据7种类别事件的发生时间,建立各类事件发生次数与月份关系的多种数学模型,以拟合度最优为评价标准,确定每类事件发生次数的最优模型。
问题4:
请建立数学模型,分析该地区2016-2020年各类事件密度在空间上的相关性,并且给出不同区域相关性最强的事件类别(事件密度指每周每平方公里内的事件发生次数)。
问题5:
请建立数学模型,分析该地各类事件密度与人口密度之间的关系(人口密度指每平方公里内的人口数量)。
问题6:
目前该地有两个消防站,分别位于区域J和区域N,综合考虑各种因素,建立数学模型,确定如果新建1个消防站,应该建在哪个区域?
如果在2021-2029年每隔3年新建1个消防站,则应依次建在哪些区域?
思路:
基本和国赛的消防救援题差不多,还简单一点,属于路径优化问题。
C题数据驱动的异常检测与预警问题赛题思路。
题目描述
推动生产企业高质量发展,最根本的底线是保证安全、防范风险,而生产过程中产生的数据能够实时反映潜在的风险。
某生产企业某日00:00:00-22:59:59由生产区域的仪器设备记录的时间序列数据(已经进行数据脱敏),本题未给出数据的具体名称,这些数据可能是温度、浓度、压力等与安全密切相关的数据。
建立数学模型,完成以下问题:
问题1:
给出的数据都可能存在波动,且所有波动都在安全值范围内。有些波动可能是正常性波动,例如随着外界温度或者产量变化的波动,或者可能是传感器误报。
这些波动具有规律性、独立性、偶发性等特点,并不能产生安全风险,我们视为非风险性异常,不需要人为干预;有些波动具有持续性、联动性等特点。
这些异常性波动的出现是生产过程中的不稳定因素造成的,预示着可能存在安全隐患,我们视为风险性异常,需要人为干预、分析和评定风险等级。
请建立数学模型,给出判定非风险性异常数据和风险性异常数据的方法。
问题2:
结合问题1的结果,建立数学模型,给出风险性异常数据异常程度的量化评价方法,要求使用百分制(0-100分)对每个时刻数据异常程度进行评价(分值越高表示异常程度越高)。
应用所建立的模型和附件1的数据,找到数据中异常分值最高的5个时刻及这5个时刻对应的异常传感器编号,每个时刻只填写5个异常程度最高的传感器编号,异常传感器不足5个则无需填满。
如果得分为0,可以不用填写异常传感器编号,并给出数学模型对所得结果进行评价。
思路:
经典的异常分析问题,异常数据一般可以用机器学习的方法做,常用的聚类。
kmeans、dbscan、决策树、孤立深林、LSTM,以上模型都可以套用进来。
问题分析就是先把问题归类,看看问题可以用哪些方法求解。把你用来解决问题的方法大致概述一下即可。问题分析如果是写实际的问题需要结合实际,分析这个问题的讨论必要性、重要性之类的。大概300百个字就差不多了。
一、问题的简述
本题为球赛单循环赛程安排的实际问题,实践性强。当有n支球队比赛时,在考虑公平性的情况下,编制赛程表,并求“上限”值以及评价赛程的优劣。其中对问题2)中的“上限”应理解为各队每两场比赛中间相隔的场次数尽量均等(即赛程安排公平)时的至少相隔场次的最大数。
二、模型假设
1.设n支球队进行单循环比赛,球队的编码依此为A、B、C ……。
2.每一场比赛都在同一场地上进行,且场地不空场。
3.各队每两场比赛中间相隔的场次数尽量均等。
4.n个队的所有比赛中,各队每两场比赛中间所有能相隔的场次数的最大值称为上限,记为M(n)。
5.不考虑其他因素,比赛始终能正常进行。
三、模型的建立及求解
有n支球队1、2、3、……n,在赛程安排时要考虑赛程的公平性,而公平性主要看各队每两场比赛中间得到的休整时间的均等程度。在赛程安排时各队每两场比赛中间相隔的场次数达到上限时才能保证对各球队的公平。
1.问题1)求解:
对于5支球队,我们把这5支球队看成是五边形的顶点,把它转化成平面网络图来分析。为了考虑公平性各队比赛间隔场数至少为1。如下图(1)所示:
A
E B
D C
图(1)
这样赛程可从B队开始顺时针安排为:第一场:B-C、第二场:D-E、第三场:A-B、第四场:C-D、第五场:A-E、第六场:B-D、第七场:C-E、第八场:A-D、第九场:B-E、第十场:A-C。把它转化成表格形式,见表(1)(注:赛程安排不唯一):
A B C D E 每两场比赛间相隔场次数
A X 3 10 8 5 1, 2, 1
B 3 X 1 6 9 1, 2, 2
C 10 1 X 4 7 2, 2, 2
D 8 6 4 X 2 1, 1, 1
E 5 9 7 2 X 2, 1, 1
表(1)
现在我给个方案你,里面是4个球队的,不过你照模式改成5个球队的就可以了啊。
为方便起见,现将这四个队伍分别命名为A、B、C、D。
下面我们分两大类情况讨论
一、
所有比赛都不出现平局
1.
请看以下三幅双向连通图:
(1)
(2
)
(3
)
这三幅双向连通图显然表示以下排名及得分的情况为:
(1)A:9
D:6
B:3
D:0
这种情况下,显然不存在并列的队伍;
(2)(A
B
C):6
D:0
这种情况下,A
B
C
并列第一,
D
第二名;
(3)D:9
(A
B
C):3
这种情况下,D第一名,A
B
C并列第二名。
以上得分及排名情况并不存在争议,在此我们不做多余的讨论。
2.
请看右边这幅双向连通图:
如右图所示,此图中各队伍的得分为:
A:6
B:3
C:3
D:6
此时按照
(A
D)(B
C)的排名方式
或者是按照
A
D
B
C
的排名方式是否就算是公平的排名方式呢?
(4)
下面我们来分析一下:
1建立模型:
定义相邻接矩阵如下:
故邻接矩阵为:
对于n=4
个顶点的双向竞赛连通图,存在正数r,
使得邻接矩阵A
r
0,A成为素阵
2模型求解:
利用Perron-Frobenius定理,素阵A的最大特征根为正单根λ,对应正特征向量S,且有
利用MATLAB新建M文件输入如下代码:
A=[0
3
3;
3
0;
3
0;
3
3
0];
V=eig(A);
X=max(V)
计算得特最大特征值:
λ=4.1860
经过归一化计算后得到矩阵:
S =(0.623,0.467,0.528,0.530)
T
所以图(4)所示的比赛排名结果为:
A
D
C
B
二、
比赛中出现平局的情况
1.
请看以下三幅双向连通图:
这三幅双向连通图显然表示以下排名及得分的情况为:
(5)A:7
D:5
B:2
D:1
这种情况下,显然不存在并列的队伍;
(6)D:9
(A
B
C):2
这种情况下,D第一名,A
B
C并列第二名;
(7)(A
B
C):2
D:0
这种情况下,A
B
C
并列第一,
D
第二名。
以上得分及排名情况并不存在争议,在此我们不做多余的讨论。
2.
请看右边的双向连通图:
如右图所示,此图中各队伍的得分为:
A:5
B:2
C:2
D:6
此时按照
(D
A)(B
C)的排名方式
或者是按照
D
A
B
C
的排名方式
是否就算是公平的排名方式呢?
同样的我们通过建立数学模型来分析一下:
1建立模型:
定义相邻接矩阵如下:
故邻接矩阵为:
对于n=4
个顶点的双向竞赛连通图,存在正数r,
使得邻接矩阵A
r
0,A成为素阵
2模型求解:
利用Perron-Frobenius定理,素阵A的最大特征根为正单根λ,对应正特征向量S,且有
利用MATLAB新建M文件输入如下代码:
A=[0
1
1
3;
1
1
0;
1
1
0;
3
3
0];
V=eig(A);
X=max(V)
计算得特最大特征值:
λ=
3.2813
经过归一化计算后得到矩阵:
S =(0.493,0.428,0.467,0.530)
T
所以图(8)所示的比赛排名结果为:
D
A
C
B
衡量一个赛程优劣,除各队每两场比赛间相隔场次数上限d这个指标外,各队在整个赛程中总间隔场次数e的差异程度E也是一个重要的指标。可设E=Emax-Emin,E越大说明各队总体休整间隔数的差异大。见表2、表3,分别是n=8,n=9的满足d=[(n-3)/2]的赛程,n=8的此赛程E=19-17=2;n=9的赛程E=28-21=7。这里n=8的赛程中差异度较小,表现出各队总体休整时间较为均匀,因而此赛程就指标而言,也较为公平的,n=9的赛程中差异度较大,因而此赛程仍有不公平性。
此外,除了每两场比赛间相隔场次数外,各队比赛之前的休息时间,即首轮比赛的出场次序,对比赛的成绩仍有一定的影响,(如在首轮中靠后面比赛可减少旅途劳累,可先观察各队情况等等)。如表2中,4队、5队首轮最后比赛,表3中,9队首轮最后比赛。实际中此因素无法解决,常采取抽签的方法来决定首轮的出场次序。
关于赛程的优劣,除考虑公平性外,还有效率性问题,即考虑如何合理紧凑地安排赛程,使赛程的从时间较短。
6.模型评价
6.1 本模型的结果成功地给出了同一场地单循环赛各队每两场比赛中间相隔场次数上限的计算公式,有一定的理论意义与实际意义。
6.2关于同一场地单循环赛赛程编派法,至今实际中都采用“循环规则”,(见上文n为偶数编派法),通过我们的研究发现此规则虽然简易、对于n为偶数的赛程,符合d=[(n-3)/2],从而有公平性,对于n为奇数,编派的赛程d[(n-3)/2],有失公平性。表4是用实际方法对n=7编制的赛程(首轮1队轮空,1队不动)。其弊端是此赛程d=1,而按公式d=[(n-3)/2]=2。说明各队每两场比赛中间极不均等,如有间隔6场,有间隔1场,具体到一个队(如5队比赛与休整时间极不均等)。从比赛与休整的节奏,第一队最有利,第五队最不利,另外从各队总间隔场次数看,也有较大差异,说明实际赛程编制法有待改进。而本模型算法提出的“生成规则”(见上文n为奇数编派法)既简便又公平。
东区15支 西区15支常规赛:一支球队要跟同区的每一支球队各打4场比赛(两场主场、两场客场)和不同区的每支球队各打两场比赛(一场主场、一场客场)。这样下来每一支球队在常规赛都要打八十二场比赛。顺便把算法写出来:一个区的比赛总场数:15× 14×(4+2)-30=1230(场) 一个区的球队总数为15个 每只球队一个赛季的比赛场数就为:1230/15=82(场)
常规赛打完,每个赛区战绩排在前八名的进入季后赛。赛区的第一名对第八名、第二名对第七名、第三名对第六名、第四名对第五名。季后赛是打淘汰制比赛,每轮比赛是七场四胜制
最终决出赛区第一名。两个赛区的第一名争夺总冠军
NBA赛程的制定和评价
【摘要】一个合理的赛程表是NBA能够精彩上演的保证。
在问题一评价07—08赛季赛程的合理性和公平性时,本文首先将赛程表的信息存放于矩阵中,然后通过设计算法从矩阵中求取所需信息,得到了各队的客场比赛数,背靠背比赛数等一系列影响合理性和公平性的因素。同时将球迷对赛程表的评价作为评价赛程表合理性的一部分,并且通过定义赛季主客场满意度,比赛精彩系数等指标将赛程的合理性和公平性量化。利用MATLAB软件计算出07—08赛季的各指标值:公平性系数为0.975,精彩系数0.1455,07—08赛季赛程的综合评定为0.5602,该赛程符合NBA的比赛规定。
在问题二中,首先我们将 定义为一种比赛双方的对阵组合, 表示队客场挑战 队。通过函数将对阵的情况数值化。在问题一的基础上,考虑了各队主客场数的平衡,背靠背比赛数的范围,各区各联盟间各队比赛场数的约束及精彩系数的最大化,综合各项指标设计出了算法排出了08—09赛季的赛程表,并用问题一中所建立的评价赛程表合理性和公平性的数学模型对设计出的08—09赛季的赛程表作出评价,得到了结论。公平性系数为0.825,精彩系数0.1630,08—09赛季赛程的综合评定为0.4940。
关键词:量化分析 赛表生成算法 合理性和公平性
NBA赛程的制定和评价
一、问题的重述
一个合理的赛程表是NBA能够精彩上演的保证。维尼克主要负责每支球队的具体赛程的制定,但是无论维尼克如何做,总有一些球队在抱抱怨,他只能尽量使得赛程安排公平合理。维尼克每个赛季给一支球队定的背靠背上限是24对,下限是15对。另外,考虑到比赛的观赏性等其他一些因素,由于历史原因,有些球队之间的比赛会格外引人注目,同样的,球队内的球星也可能成为影响赛程安排的因素,此外,一些节日比赛安排会有所不同,很明显周末比赛相对紧密,而每个星期天似乎都会有一场精彩的比赛,再比如每年的圣诞大战。所有这些都在一定程度上增加了比赛安排的复杂性。要求:对NBA 2007-2008赛季常规赛赛程的安排,讨论其合理性和公平性。根据问题(1)得出的模型与结论,给出NBA常规赛赛程安排模型,并制定NBA 2008-2009 赛季的常规赛赛程,并给出评价。
二、模型的基本假设
1、假设考察一个赛程安排是否合理主要考虑下面这三个因素:是否满足赛制的要求,球队的满意度,球迷的满意度。
2、假设个球队的排名情况和拥有的球星数能够说明该队的受关注程度。
3、假设各球队对赛程的满意度仅取决于对“主客场数”和“背靠背数”的满意度。
4、假设球迷对赛程的满意程度主要取决于重要比赛的安排时间。
5、假设08—09季度的比赛每个周末比赛日的比赛场数固定,非周末比赛日比赛场数大体相等。
6、假设在对08—09赛季的赛程安排时,只考虑节假日里不安排比赛,不考虑其他因素的比赛的影响。
三、符号说明
符号表示的意义
记录2007—2008赛季各场比赛信息的 的矩阵
存储个球队在2007—2008赛季客场比赛数的数组
存储各球队在2007—2008赛季背靠背比赛数的数组
记录30支球队再2007—2008赛季排名信息的 的矩阵
第 队与第 队到第 天为止,队为主场, 队为客场的两队的交锋次数
和的不分主客场的交锋次数
描述对阵形势及对应对阵形势下比赛场数的矩阵
队客场挑战队的对阵形式
队和 队在这种对阵形式下进行的对赛场数
队和队比赛的精彩系数
每个赛季的比赛观赏系数与每场比赛观赏性系数的和球队对主客场数的满意度
球队对背靠背数的满意度
第支球队的整体实力系数
第支球队的打比赛时的精彩系数
将 队客场挑战队这场比赛映射为一个数值的函数
四、问题的分析和模型的建立
问题一模型建立
对于每个赛程的合理性和公平性,可由下面3个主要因素来衡量:
l 四条硬性的要求
1)每个分区的球队在常规赛中要与在同一个分的球队比赛四场
2)分区的每支球队要与分区以外,但是在同在一个大赛区的每个球队相遇三到四次
3)小赛区的每支球队要与不同大赛区的每支球队比赛两场
4)共用同一个比赛场馆的球队的主场比赛不能在同一天进行。
l 球队从自身利益出发对赛程的满意程度
l 观众对赛程的满意程度,尤其表现在对某些重要比赛的时间安排上
1、对2007—2008赛季的赛程安排关于四条硬性要求的检验
各球队的分区情况如表一所示:
东部赛区
西部赛区
大西洋分赛区
太平洋分赛区
波士顿凯尔特人 1
洛杉矶湖人
16
新泽西网
2
萨克拉门托国王
17
纽约尼克斯
3
菲尼克斯太阳
18
费城76人
4
金州勇士
19
多伦多猛龙
5
洛杉矶快船
20
中央分赛区
西北分赛区
底特律活塞
6
明尼苏达森林狼
21
印第安纳步行者
7
犹他爵士
22
密尔沃基雄鹿
8
丹佛掘金
23
芝加哥公牛
9
波特兰开拓者
24
克里夫兰骑士
10
西雅图超音速
25
东南分赛区
西南分赛区
迈阿密热火
11
新奥尔良黄蜂
26
奥兰多魔术
12
达拉斯小牛
27
华盛顿奇才
13
圣安东尼奥马刺
28
亚特兰大老鹰
14
休斯敦火箭
29
夏洛特山猫
15
孟菲斯灰熊
30
题目中给出的常规赛赛制为:
1)每个小赛区的球队在常规赛中要与在同一个小赛区的球队比赛四场。
2)分赛区的每支球队要与分赛区以外,但是在同在一个大赛区的每个球队相遇三到四次。
3)小赛区的每支球队要与不同大赛区的每支球队比赛两场。
因此我们可以得到:每个球队的比赛场数为:
1 .1分区内赛程安排检验
一共有6个赛区,各赛区内球队的编号分别为:
大西洋分赛区:1—5 中央分赛区: 6—10
东南分赛区: 11—15 太平洋分赛区:16—20
西北分赛区: 21—25 西南分赛区: 26—30
在讨论赛程的合理性和公平性时,必须要对每支球队在分赛区的赛程安排进行检验。要求每个分赛区的球队在常规赛中要与在同一个分赛区的球队比赛四场。
1.2同赛区不同分区的赛程安排检验
在讨论赛程的合理性和公平性时,必须要对每支球队在同一赛区不同分区的赛程安排进行检验。要求分赛区的每支球队要与分赛区以外,但是在同在一个大赛区的每支球队相遇三到四次。
如:编号为1—5的球队与编号为6—10的球队就属于同赛区不同分区的情况。则编号为1—5内的每个球队需要与编号为6—10内的每个球队比赛3—4场。
1.3不同赛区内的赛程安排检验
在讨论赛程的合理性和公平性时,还需要对每支球队在不同赛区的赛程安排进行检验。要求小赛区的每支球队要与不同大赛区的每支球队比赛两场。
如:编号为1—15的球队与编号为16—30的球队就属于不同大赛区的情况。编号为1—15内的球队需要与编号为16—30的球队比赛两场。
只有当一个赛程的安排同时满足上面的三个条件时,该赛程才符合了赛程安排的基本要求,才能够进一步进行合理性和公平性的分析。
2、球队对赛程的满意程度的评价
对于一个确定的赛程,球队就有确定的主客场数、背靠背数、连续客场作战数等,而球队会从自身利益出发对自己的赛程做出评价,一个合理公平的赛程能够最大程度减少各球队的抱怨。也就是使各球队的主客场数、背靠背数、连续客场作战数都大致相等。
2.1为了对球队的满意程度进行量化分析,我们首先需要对给出的附录(07—08赛季赛程安排)进行处理和记录。
对题目已知信息的处理:
1) 对比赛日期的处理:对日期进行编号。将07—08赛季10月31日作为第一天,记为“1”,以后每天的编号为前一天的编号加1。比如:11月1日则应该记为“2”,11月2日记为“3”……依次类推。
2) 对球队队名进行编号,其编号如表一
3) 对比赛对应的北京时间的处理:
将比赛时间在北京时间上午的记为:1
将比赛时间在北京时间凌晨的记为:0
根据前面对比赛日期、球队队名、对应北京时间的处理,可以建立描述
每场比赛信息的线性数据结构如图一:
d
k
z
t
(图一)
: NBA常规赛日期(d )
: 客队队名的编号(k )
: 主队队名的编号(z )
: 对应的北京时间(t )
例如有这样一个数据单元:
8
26
16
1
它提供的比赛信息为:11月7日(周三)进行的比赛一场NBA比赛,客队为新奥尔良黄蜂,主队为洛杉矶湖人,北京时间为上午。
按照上面的方法,我们将NBA常规赛10月赛程的1230场比赛全部列出,可以得到一个 的矩阵(全部矩阵见附录1)。该矩阵能反映赛程的全部信息。
2.2 各球队对赛程安排满意度的分析
通过给出的材料,我们知道“每支球队的主客场数”、“背靠背数”、“连续客场数”这几个因素是衡量球队满意度的主要因素。
2.2.1 各球队主客场数的讨论
用数组 [30]存储各球队客场比赛数。可用MATLAB计算出数组中各元素的值(程序见附录2)。其中 表示第 个球队的客场比赛数。
由于每支球队在2007--2008赛季一共要进行82场比赛,所以在绝对公平的情况下,每支球队在该赛季的客场数与主场数应该相等,各为41场。
考虑到球队对主客场数抱怨是因为自己比别队的客场数多,为了定量的说明球队对主客场数的满意程度我们定义
(其中为整个赛季30支球队,客场比赛数最大值与最小值之差)
为主客场数的满意度指数。
即 表示球队对安排的主客场数的满意度。
【注】: 时(即:各队都有41场客场和41场主场),,表示对安排的主客场数完全满意。
时(即:第 队有82场客场,而第 队有0场客场),,表示对安排的主客场数完全不满意。
2.2.2 各队背靠背比赛场数的讨论
用数组 来存储每个球队背靠背比赛的场数。可用MATLAB计算出数组中各元素的值(程序见附录2)。 表示第 支球队参加的背靠背比赛数。
球队都希望自己的背靠背比赛数尽量少,但是竞赛委员会为了公平公正,应该尽量照顾到每支球队,因此竞赛委员会在每个赛季给一支球队定的背靠背上限是24对,下限是15对。为了定量的说明球队对背靠背数的满意程度,我们定义
(其中表示:整个赛季30支球队里背靠背比赛数最大值和最小值之差)
为球队对背靠背数的满意指数
即 表示各球队对安排的背靠背数的满意度。
【注】: 时(即:各球队的背靠背数相等),,表示对安排的背靠背数完全满意。
时(即:第 球队的背靠背数为0),,表示对安排的背靠背数完全不满意。
3、观众对赛程安排的满意程度
观众想要观看一场比赛,主要会考虑到比赛的精彩度。而对于观众来说,一场比赛是否精彩,一方面是看对抗的两个球队的实力是否强大,一般来说,实力越强的两个球队进行比赛,观看的人将会越多;另一方面,观众都有自己喜欢的球星,因此,比赛中两队的球星越多越能吸引观众。
因此,影响观众对赛程满意程度的两个主要因素就是:“各球队的实力”和“球星的影响力”。
l 各队的实力
对参加NBA常规赛的这30支球队进行编号,其编号如表一所示。根据07—08赛季对这30支球队的排名情况,我们可以得到一个关于这30支球队排名信息的的矩阵 :
=[1,20,27,14,12,3,18,25,22,8,30,6,10,16,23,
2,21,11,17,24,26,7,15,19,29,4,13,5,9,28]
为了定量的描述球队的实力,我们定义
()
(其中 表示第 支球队在07—08赛季的排名)
为球队的整体实力系数。
【注】: 时(即第 支球队排名为第1)。,表示该球队实力最强。
时(即第 支球队排名为第30)。,表示该球队实力最弱
l 球星的影响力
我们将参加上赛季全明星的队员设定为具有个人影响力的球星。
其名单为:姚明(火箭) 科比(湖人) 邓肯(马刺) 艾弗森(掘金) 安东尼(掘金) 勒布朗-詹姆斯(骑士) 德怀特-霍华德(魔术) 波什(猛龙) 韦德(热火) 基德(篮网) 纳什(太阳) 保罗(黄蜂) 斯塔德迈尔(太阳) 诺维茨基(小牛) 布泽尔(爵士) 大卫-韦斯特(黄蜂) 罗伊(开拓者) 雷-阿伦(凯尔特人) 比卢普斯(活塞) 贾米森(奇才) 乔-约翰逊(老鹰) 汉密尔顿(活塞) 保罗-皮尔斯(凯尔特人) 拉希德-华莱士(活塞)
为了对球星的影响力进行定量描述,我们可以做如下处理:
将首发的影响力记为:2;替补的影响力记为:1。则由07—08赛季的全明星名单可得到:
=[2,2,0,0,2,2,0,0,0,2,2,2,1,1,0,2,0,2,0,0,0,1,4,1,0,2,1,2,2,0]
为各队的球星影响力系数矩阵(按1到30的球队编号)则:
假设:综合实力和球星效应对球队的影响力有相同的权重,则有:第队对观众的吸引系数,亦即第 支球队的比赛的精彩系数:
问题一的结果分析
1. 对2007—2008赛季的赛程安排关于四条硬性要求的检验结果分析
利用MATLAB软件我们可以求得记录第 支球队与第支球队()在2007—2008赛季中比赛场数的矩阵 。
=
[0 4 4 4 4 3 3 4 4 4 4 3 4 3 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 0 4 4 4 3 4 4 3 4 3 4 3 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 0 4 4 4 4 3 4 3 4 4 3 4 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 4 0 4 4 3 4 4 3 3 4 4 4 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 4 4 0 4 4 3 3 4 4 3 4 3 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 3 4 4 4 0 4 4 4 4 4 4 3 4 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 4 4 3 4 4 0 4 4 4 4 3 4 3 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 3 4 3 4 4 0 4 4 4 3 4 4 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 3 4 4 3 4 4 4 0 4 3 4 3 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 3 3 4 4 4 4 4 0 3 4 4 3 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 3 4 3 4 4 4 4 3 3 0 4 4 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 4 4 4 3 4 3 3 4 4 4 0 4 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 3 3 4 4 3 4 4 3 4 4 4 0 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 4 4 4 3 4 3 4 4 3 4 4 4 0 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
4 4 3 3 4 3 4 3 4 4 4 4 4 4 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 0 4 4 4 4 3 4 3 4 4 4 4 4 3 3
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 0 4 4 4 3 4 3 4 4 4 3 4 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 0 4 4 4 3 4 3 4 3 3 4 4 3
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 4 0 4 4 3 4 4 3 3 4 3 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 4 4 0 4 4 4 3 3 4 4 3 3 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 4 4 4 0 4 4 4 4 4 3 4 3 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 3 3 4 4 0 4 4 4 4 4 4 3 3
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 4 4 4 4 4 0 4 4 3 3 3 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 3 4 3 4 4 4 0 4 4 4 4 4 3
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 4 3 3 4 4 4 4 0 3 4 3 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 3 3 4 4 4 3 4 3 0 4 4 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 3 3 4 4 3 4 3 4 4 4 0 4 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 4 4 4 3 3 4 4 3 4 3 4 4 0 4 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 4 4 4 3 3 3 4 4 4 4 4 4 0 4
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 4 3 4 4 4 3 4 3 4 4 4 4 4 0]
中的元素 表示2007—2008赛季编号为的球队与编号为的球队所进行的比赛场数。 是一个完全对称的矩阵,其对角线上的元素为 ,表示球队不能与自身进行比赛。()的取值为3或者4,这满足了“分区的每支球队要与分区以外,但是在同在一个大赛区的每个球队相遇三到四次”和“每个小赛区的球队在常规赛中要与在同一个小赛区的球队比赛四场”。()的取值为2,这满足了“小赛区的每支球队要与不同大赛区的每支球队比赛两场”。
所以我们可以得到结论:NBA 2007-2008赛季常规赛赛程的安排是合理且公平的。
2、球队对赛程的满意程度的评价结果分析
利用MATLAB软件,我们可以得到存储各球队在2007—2008赛季客场比赛场数的数组的值。
B =
[41 41 41 41 41 41 41 41 41 41 41 41 41 41 41
41 41 41 41 41 41 41 40 42 41 41 41 41 41 41]
可以看到,这30只球队,其中有28支球队在2007—2008赛季的客场数有41场,只有一支球队(丹佛掘金)的客场数有40场,一支球队(波特兰开拓者)的客场数有42场。而我们已经分析了,一个合理公平的赛程安排,对于每支球队来说:应该使每支球队的主客场数尽量相等。因此,NBA组委会在对2007—2008赛季赛程安排关于各队主客场的安排是合理、公平的。
3、观众对赛程安排的满意程度评价结果分析
由MATLAB计算出:
各球队综合实力系数向量为:
[1,0.9344,0.1344,0.1111,0.0178,0.4444,0.3211,0.2178,0.4011,0.0544,0.8711,0.0278,0.1878,0.6400,0.0400,0.2844,0.0900,0.1600,0.5878
0.0044,0.0011,0.8100,0.6944,0.3600,0.4900,0.7511,0.2500,0.5378,0.0711,0.0100];
各球队球星影响力向量为:
[0.6000,0.6000,0.2000,0.2000,0.6000,0.6000,0.2000, 0.2000 ,0.2000
0.6000,0.6000,0.6000,0.4000,0.4000,0.2000,0.6000,0.2000,0.6000,0.2000,0.2000,0.2000,0.4000,1,0.4000,0.2000,0.6000,0.4000,0.6000,0.6000,0.2000];
各球队的综合实力和球星影响的平均系数向量为:
[0.8000,0.7672,0.1672,0.1556,0.3089,0.5222,0.2606,0.2089,0.3006,0.3272,0.7356,0.3139,0.2939,0.5200,0.1200,0.4422,0.1450,0.3800,0.3939,0.1022,0.1006,0.6050,0.8472,0.3800,0.3450,0.6756,0.3250,0.5689,0.3356,0.1050];
由假设可知,观众对于赛程安排的满意程度与各球队的综合实力和球星影响力的平均系数向量有关。观察“各球队的综合实力和球星影响的平均系数向量”可知各球队让观众满意的能力有大有小,且差异比较明显。故此我们可以在不违反赛程公平和合理的前提下,多安排影响力大的球队进行比赛。
问题二的数据分析和模型求解
1. 对比赛对阵组合的描述
用 来表示一场比赛的对阵形势,其中 的意义是: 队客场挑战 队。用表示2007—2008赛季 队和 队在这种对阵形式下进行的比赛场数。因为有30支球队,所以共有900种对阵形势。而按照NBA比赛场数的规定,每个球队的比赛场数为:
根据的关系及每个球队和不同球队比赛场数要求可以将900种对阵形势可分为以下四类:
1)、,表示球队和自身进行比赛,事实上,比赛不会进行。
2)、“ ”或“ ”等六种情况,表示同一分区内两个球队进行比赛。根据NBA比赛场数的规定,两队需进行4场比赛。
3)、“ 且 ”或“ ”等六种情况表示同一赛区不同分区间两个球队进行比赛。根据NBA比赛场数的规定,两队将进行 场比赛;
4)、 且,表示不同赛区间两个球队进行比赛。根据NBA比赛场数的规定,两队将进行两场比赛。
2.对比赛对阵组合的处理
2.1 建立对阵形势的转化函数及转换关系
为了方便描述和处理数据,我们建立了对阵形势 和自然数的线性对应关系,其函数关系为:
容易知道: 和自然数 形成一一对应的关系。用 作为 的代号,数字 和的对应关系为:
( 为取余符号)
这样就建立了对阵形势 和自然数的相互转换关系。
2.2 建立描述对阵形势及对应对阵形势下比赛场数的矩阵
矩阵的大小为 。
表示: 队客场挑战 队这种对阵形式
表示: 队和 队在这种对阵形式下进行的总的比赛场数
考虑到球队的主客场数的平衡,所以尽量使 与相等。
根据的关系及各队间比赛场数的要求有下面四条结论:
1)、 比赛不会进行,
2)、“ ”或“ ”等六种情况,两队将进行4场比赛,分别两场主场、两场客场,则
3)、“ 且 ”或“ ”等六种情况,两队将进行3—4场比赛。若进行3场比赛,则一个球队打一个主场两个客场或是一个客场两个主场,;若进行4场比赛,则一个球队打两场主场两个场客场,
4)、 且,两队将进行两场比赛,每个队打一场主场一场客场,
根据以上原则用MATLAB软件编制程序得到描述对阵形势及对应对阵形势下比赛场数的矩阵。
【注】:其中 已经考虑到了比赛主客场数的平衡。
3.由矩阵生成比赛表的算法
3.1准备工作
首先确定下赛季可用的比赛日
参照08—09年的日历和美国法定节假日的基本信息,设定2008年11月1日(周六)到2009年04月17日(周五)为比赛日区间。其中周末比赛日有48天,非周末比赛日有116天。比赛日共计164天。下面介绍比赛日生成的过程。
为了方便,假设每个周末比赛日有 场比赛,每个非周末比赛日有场比赛。考虑到周末比赛的收视率一般高于非周末比赛的收视率,规定 。则 、 应该满足约束方程: 。用线性规划解方程可得 为5,为3或4,即每个周末比赛日进行5场比赛,每个非周末比赛日进行3或4场比赛。
3.2 算法的设计
3.2.1算法要求:
1)、每支球队需要满足背靠背比赛场数在范围的要求
2)、每支球队主客场数的平衡及满足NBA规定的各队间的比赛场数(由2.2生成的矩阵已经满足该要求)。
3)、在1)和2)的前提下尽量通过赛程的安排提高比赛的观赏性。
3.2.2算法设计:
1)、处理背靠背比赛场数
由对阵形势 知道:对于 队 ( )都表示 队的客场比赛。所以对队的背靠背比赛的安排转换为在 ( )中任选两种对阵形势,然后将两种对阵形势分别安排在相邻的两天,即形成队的1个背靠背。然后通过重复执行该操作可以安排任意球队的背靠背比赛数,使满足背靠背比赛数在 之间。
2)、处理主客场数及各队间比赛场数
事实上,在2.2生成矩阵 时已经考虑了该要求,所以矩阵满足主客场数和各队间比赛场数的要求。
3)、 提高比赛的观赏性
由问题一已经知道,各队间比赛的观赏的精彩系数 , 表示 队与队进行比赛时的精彩系数。
由 将各队间的比赛转化成序列。并且由于每一场比赛发生的时间不同,所以比赛的影响系数不同。(比如周末和非周末)系数序列为 ,并且 。
设每个赛季的比赛观赏性系数与每场比赛观赏性系数的和为:
【引理】 对于序列 及 如果满足:,则两个序列的乘积有不等式:
并且 为所有序列相乘和的最大值。(证明略)
五、模型评价和改进方向
1.模型的优缺点
1)模型的优点:考虑了球队,球迷对赛程公平性的影响,考虑的因素比较全面;自定义了各种评价赛程公平性和合理性的各种系数,量化了赛程的合理性和公平性;
2)模型的缺点:在求取赛程的算法中,赛程的表述只是用数字表述,未能用具体球队的对阵形势给出,不方便查阅;未能实现数据的完全自动化处理。
2.改进方向
应该尝试实现数据的自动化处理;做大量的调查获取数据对自定义的各种系数做修正,使其更好的反映赛程表的各项指标。
六、参考文献
[1]左孝凌等 《离散数学》上海 上海科学技术文献出版社 1981年
[2]刘琼荪 龚劬等《数学实验》北京 高等教育出版社 2004年
[3]NBA数据库 08年07月24日