科学文献-广告行销002：对央视抽样收视率的评介和数据校正研究

广告业要保持快速、持续、稳定的发展，就必须向受众提供强有力的“注意力资源”，正如赫伯特&S226;西蒙曾经对后信息社会特征所作的描述：随着信息的发展，有价值的不是信息，而是你的注意力。“注意力资源”是一种重要的流通元素和资源，受众对广告的注意力越集中越强烈，就意味着资源的稀缺性越强，价值也与日俱增。然而，在我们研究“注意力资源”的稀缺性和行业广告费投向时，我们往往会忽视一个基础的依据和标准，这就是调查数据的抽样的样本选择，任何主观化和强加意志的样本选择，都容易失去标准的客观性，也会使抽样收视率（或收听率）严重背离实际收视率（或收听率），最终误导了电视台、国际制片商、本地和国际的广告代理商、媒体购买商和广告主，这个影响可就大了。

虽然如此，我们仍离不开权威的收视调查数据，无论是媒体对传播效果的自我评价，还是微观企业的广告投放，都需要有抽样收视率（或收听率）的支持，它是作出其它客观和定量分析和推论的基础，也是目前评价“注意力资源”的最重要、最基本的标准和量度。

在以下的讨论分析中，是从中央电视台最权威的收视率调查着手（姑且只讨论电视传媒的收视率问题），来探讨抽样收视率调查数据的可信度，然后，再从主体和受众的普遍需求出发，提供一种校正抽样收视率的方法，尽可能地减少抽样误差。

1 正确看待央视收视率

1.1 抽样收视率的样本选择

大多数人在获得央视抽样收视率后，都会屈服于收视调查的权威性和使命感，丝毫不会怀疑收视率数据的准确性和客观性，这是比较危险的。对于任何调查数据，我们都要抱着客观的态度去审视它，详实地考察它的抽样状况，如抽样地点、样本数量、样本的构成、调查人员、统计人员等等，倘如只看到抽样的外在表现（抽样收视率），而忽视抽样的本质和基础，就很可能再现“一叶障目”的局面，不可能正确评介媒体传播的实际效果。

抽样收视率的失真和误导确实带给了我们不少麻烦，无限追涨的“标王”现象、效果等同的媒体报价却谬以千里、媒体垄断性的批零销售、业务操作中的广告贿赂和回扣之风有所蔓延……这都不能不引起我们的足够重视，也不油然使得我们在投放广告前必须要谨慎、客观地考察各种媒体收视率的可靠性和真实性。倘如抽样收视率是客观的、真实的，广告的投放就会很自然，一份广告投入就必有一份产出，既容易量化各种媒体，也能稳定和规范媒体报价，各种媒体之间的替代性加强了，一者，杜绝了垄断的发生，容易实现已开发广告资源的共享和双赢；二者，有利于广告业的稳定和持续发展，避免了众多的违规事件和操作失误现象。

我们经常见到的央视收视率调查数据，大略是选取了较多的城市样本点和较少的乡村样本点，加之样本数量很小和典型性不强，就无疑加大了抽样调查的误差，很难体现和代表全国人的真实收视原貌。以下是央视收视率抽样的样本构成情况（至今仍在使用），见表1。

表1：中国各地区样本构成情况

编号	地区	城市人口样本家庭数	乡村人口样本家庭数
1	保定（河北）	100	0
2	北京	300	200
3	蚌埠（安徽）	100	0
4	长春（吉林）	300	0
5	长沙（湖南）	300	0
6	常熟（江苏）	0	100
7	成都（四川）	300	0
8	重庆	300	0
9	大连（辽宁）	300	0
10	达县（四川）	0	100
11	德州（山东）	100	0
12	抚顺（辽宁）	100	0
13	福州（福建）	300	0
14	广州（广东）	300	0
15	贵阳（贵州）	300	0
16	海口（海岛）	300	0
17	杭州（浙江）	300	0
18	哈尔滨（黑龙江）	300	0
19	合肥（安徽）	300	0
20	呼和浩特（内蒙古）	100	0
21	济南（山东）	300	100
22	昆明（云南）	300	0
23	兰州（甘肃）	300	0
24	拉萨（西藏）	100	0
25	临沂（山东）	100	0
26	南昌（江西）	300	0
27	南京（江苏）	400	0
28	南宁（广西）	300	0
29	宁波（浙江）	100	0
30	莆田（福建）	0	100
31	青岛（山东）	300	0
32	曲阜（山东）	0	100
33	上海	300	0
34	沈阳（辽宁）	300	0
35	深圳（广东）	300	0
36	石家庄（河北）	300	0
37	苏州（江苏）	100	0
38	太原（山西）	300	0
39	天津	300	100
40	乌鲁木齐（新疆）	100	0
41	武汉（湖北）	300	0
42	厦门（福建）	300	0
43	西安（陕西）	300	0
44	西宁（青海）	100	0
45	雅安（四川）	0	100
46	烟台（山东）	100	0
47	银川（宁夏）	100	0
48	永济（山西）	0	100
49	郑州（河南）	300	0
50	自贡（四川）	0	100
51	宝坻（天津）	0	100
52	江川（云南）	0	100
53	南阳（河南）	100	0
54	白城（吉林）	100	0

观察表1数据，可发现央视收视率抽样样本的三个特征：

首先，抽样点基本上是省会城市和发达地区。

其次，在抽样点选取的指标“城市人口样本家庭数”远远超过“乡村人口样本家庭数”。据统计，抽取的城市人口样本家庭数为10600，抽取的乡村人口样本家庭数为1300，城市人口样本家庭数和乡村人口样本家庭数分别占抽样总家庭数的89.08%和10.92%。

最后，样本数量和抽样家庭数量太小。从央视的收视调查情况看，全国共选取了54个样本，若以全国12.9亿人口，每5人组成一个家庭计，则抽样家庭仅仅占到全国总家庭数的0.0046124%。

1.2 对目前央视抽样收视率的评介

我认为，抽样的基础决定了收视率结果的取得，因此，按目前的方法去做抽样调查，就会造成抽样收视率的误差较大，很难把此结果作为评判央视收视效果的标准。

1.2.1 采集的样本点主要为城市，在样本点抽样的家庭也主要为城市，差不多占到了抽样总家庭数的89.08%，此抽样缺点之一。抽样调查之所以在城市抽样较多，可能也与以下几个因素有关。

1.2.1.1 城市人口较为集中，使得抽样活动开展起来较为方便、快捷，也便于解决调查站人员的衣食住行。乡村人口较为分散，交通、通讯均不方便，调查人员难以了解到瞬时的收视情况，也是在乡村设点较少的原因之一。

1.2.1.2 为了保证收视调查数据的稳定性，所以，每季度轮换的样本户不能太多，即轮换的样本户仅为8.3%；如果轮换的样本户所占比例太大，就会因抽样家庭数占全国总家庭数的比例（即0.0046124%）太小，而呈现出抽样收视率的非稳定性和无规律性。

1.2.1.3 降低抽样成本也是导致城市样本采集过多的因素之一。很明显，采集过多的城市样本，可以压缩抽样调查的成本，此外，每季度轮换的样本户不多，也利于减少抽样的开支和人员。

1.2.2样本的采集带有很强的主观色彩，没有明确的标准和依据，也影响到抽样收视率的结果。

1.2.2.1 样本采集应从全局出发，针对人口的地区分布随机取样，而不应、也不能只针对收看到央视节目的观众，换句话说，没有收看到央视节目的“观众”也应是抽样的对象。

1.2.2.2 对于地区样本点的选择，典型性和随机性不强。如果抽样地区的样本具有典型性，就可以基本反映城乡家庭的比例，即乡村家庭：城市家庭=9：4；如果能在样本点随机抽样，就应该体现乡村家庭站多数的状况，也就不会有城市抽样家庭占89.08%的抽样失误。

1.2.2.3 单纯为了研究而去研究，是很容易忽略实证的基础的。央视抽样区域选取的一个重要指针，就是瞄准了央视的直接观众，所以，由于各地区实际能收看到中央电视台各套节目的人口比例不完全相同，央视对各套节目相关的研究总体也有所不同。这种做法表面上看来是很科学的，但实际上是背离了客观事实，尤其是针对全国整体的收视率抽样调查而言，就难免会有断章取义之嫌。

1.2.2.4 根据人口的城乡分布状况，设计抽样是可行的。在采集样本之前，有必要考察一下区域人口的城乡分布状况，无论之后是典型抽样，还是随机抽样，只要我们能大体上把握抽样活动的几个基本问题，就不会犯一些像“城市抽样89.08%，乡村抽样10.92%”的原则性错误。我认为，比例较大的城市抽样家庭数只能说明城市家庭的抽样收视率，不足以说明全国城乡家庭的收视状况。

1.2.3目前的央视收视率报告还算比较客观地反映了中国城市的收视率，但并没有足够的理由来说明乡村的收视状况，究其实，要体现乡村的实际收视状况，乡村，尤其是乡村的收视对象是绝对不可以忽略的。

1.3 收视抽样的陷阱

客观的收视调查结果可以提供给广告管理机构、行业、企业一个重要的参考标准，也是制订广告价目表和投放广告的最有力依据，然而，如果调研数据是失真的，就会导致微观企业以致整个行业的无序性，浪费了大量的广告资源不说，客户也常因投放了大量的广告而收获甚微，丧失对广告投放的信心；同时，媒体和广告公司也因不能正确协助和诱导企业投放广告，逐渐失去与客户的沟通，而且，客户和受众会逐渐认为广告对经济无任何激励作用，这个影响可就大了。一言以蔽之，误导的抽样收视率可能会导致广告投放的信心下降，信心的丧失无疑又会使广告业遭到打击。

倘如把现行的央视不同栏目的抽样收视率都作为全国收视率，就很容易犯一个“以偏概全”的错误，误导了国内的有效需求和供给。我认为，广告管理机构如能提供一系列客观的抽样数据等标准，诸如：电视栏目的收视率、广播节目的收听率、户外媒体的注意率、网络广告的点击率等，就可为媒体的替代和选择提供参照标准和依据，有利于维护广告业的繁荣与稳定，诚如是，广告主和客户才不会掉到陷阱之中，整个广告业也才会更有规范和秩序。

2 对央视抽样收视率的校正

2.1 收视率校正的基本方法

对于错误的收视率数据，我们只能采取两种态度：一是彻底地抛弃；二是校正数据，减少误差。鉴于央视的收视率抽样调查已经耗费了大量的人力、物力和资金，又没有其它的抽样数据可供参考，所以，考虑到成本的因素，也不可能采取大面积的随机取样调查方式，每季度轮换的样本户也不可能太多，但如果使用这来之不易的数据，又容易受到误导。出于以上的考虑，我采用数据校正的方法，充分利用原有的调研数据，通过适当的校正计算，尽可能探求比较客观、真实的收视率数据。在这里，仅是提供一个分析问题的思路，以供读者借鉴推广。

假定央视抽样的城市家庭数为m₁，抽样的乡村家庭数为n₁，抽样的全国收视率为E_r1（即预期收视率，Expectant Rate）, 且抽样的城市和乡村家庭收视率分别为a₁和b₁；再假定中国的实际城市家庭数为m₂，中国的实际乡村家庭数为n₂，央视的实际收视率为E_r2，且城市和乡村家庭的收视率分别为a₂和b₂，则有：

(a₁m₁+b₁n₁)/(m₁+n₁)=E_r1 (1)

(a₂m₂+b₂n₂_{)/(m₁+n₁)=E_r2 (2)}

由于抽样误差主要是由城市和乡村抽样家庭数不当引起的，所以，单就城市家庭抽样收视率和乡村家庭抽样收视率而论，城市抽样点有城市家庭抽样收视率，乡村抽样点有乡村家庭抽样收视率，央视样本的数量和地区构成基本上不影响这两个指标，换言之，央视的抽样调查中的这两个指标是有效可信的，由此认定城市家庭抽样收视率和乡村家庭抽样收视率就是城市家庭实际收视率和乡村家庭实际收视率，即有如下的推定结论：a₁=a₂=a,b₁=b₂=b(a、b分别为城市家庭抽样收视率和乡村家庭抽样收视率，或者为城市家庭实际收视率和乡村家庭实际收视率)。把（1）、（2）式合并整理，可以得到公式（3）：

E_r2= [(1+n₁/m₁)E_r1+(n₂/m₂-n₁/m₁)b] /[1+n₂/m₂] (3)

令m₁=10600,n₁=1300(m₁、n₁的数据分别为央视收视调查的城市抽样家庭数和乡村抽样家庭数)；如果按中国城乡的人口比例抽样，则可令m₂/n₂=3.9/9（假定中国有3.9亿城市人口和9亿乡村人口，实际上乡村人口是有点低估了），因此，可以把（3）式简化为（4）式（以下简称该公式为“收视率换算公式”）：

E_r2=0.3394E_r1+0.6606b （4）

2.2 对乡村家庭平均收视率的估算

抽样收视率和实际收视率的换算公式（4），是笔者推论出的校正目前收视数据的基本公式，公式中存在一个“瓶颈”问题，这就是要取得一个客观的、瞬时的b值，这是进一步简化公式和求得实际收视率的关键。正因乡村家庭抽样收视率颇具客观性和普遍性，所以，把它认定为乡村家庭实际收视率；也为了估算的方便，笔者仍然采用目前的央视抽样收视率，来估算瞬时的、平均的乡村家庭实际收视率，但对于选取的“晚间时段收视率分类结果”的数据有效性，还有待进一步商榷；这个数据的选取也因没有考虑到不同学历人口的比重、城乡比例等众多因素，可能会导致实际收视率结果的普遍低估。见表2。

表2：中央一套晚间时段收视率分类结果（%）（18：00—24：00）

星期一至星期五中央一套

时段	高中	初中	小学	不识字	乡村家庭抽样收视率 (b)
18：00	1.1	1.5	3.3	5.0	2.725
18：15	1.2	1.7	4.0	6.0	3.225
18：30	1.4	1.8	3.8	6.0	3.250
18：45	1.9	2.1	3.4	5.3	3.175
19：00	30.5	24.2	20.7	18.1	23.375
19：15	31.4	25.5	21.5	18.3	24.175
19：30	29.0	24.3	20.9	16.3	22.625
19：45	20.7	16.7	14.0	11.1	15.625
20：00	12.5	9.1	7.5	6.2	8.825
20：15	10.8	7.7	6.4	6.1	7.750
20：30	10.2	7.2	6.0	5.6	7.250
20：45	9.8	6.9	5.4	5.0	6.775
21：00	8.9	6.1	4.3	3.9	5.800
21：15	8.1	5.3	3.3	3.0	4.925
21：30	7.6	4.8	3.2	2.5	4.525
21：45	5.8	3.6	2.5	1.8	3.425
22：00	3.7	2.2	1.5	1.1	2.125
22：15	2.4	1.3	0.9	0.6	1.300
22：30	2.0	0.9	0.7	0.5	1.025
22：45	1.0	0.4	0.3	0.2	0.475
23：00	0.5	0.2	0.1	0.0	0.200
23：15	0.4	0.2	0.1	0.1	0.200
23：30	0.3	0.2	0.1	0.1	0.175
23：45	0.2	0.1	0.1	0.0	0.100

注： 1）以上的“高中”、“初中”、“小学”、“不识字”四栏数据是2000年11月19日—11月25日的央视抽样收视率；

2）“乡村家庭抽样收视率”栏数据是由每行前四栏数据平均求得的均值。

2.3 对抽样收视率的校正

按照表2的抽样时间和时段，下面把央视一套的晚间抽样收视率作为研究对象，见表3。根据收视率换算公式E_r2=0.3394E_r1+0.6606b，可以求得不同时段的实际收视率，见表4。

表3：样本地区中央一套节目晚间收视率（2000年11月20日星期一）

时间	中央电视台一套栏目	抽样收视率（%） (E_r1)
18：00	新闻	1.77
18：05	广告	1.77
18：09	大风车（2000-325）	2.05
18：49	广告	2.54
19：00	新闻联播	37.94
19：35	广告	26.98
19：39	焦点访谈	23.06
19：51	广告	15.86
20：06	荣事达杯节目主持人大赛	7.99
21：51	广告	4.79
22：00	世界报道	2.75
22：17	广告	1.84
22：19	晚间新闻	1.84
22：29	广告	1.64
22：31	体育新闻	1.31
22：48	广告	0.68
22：56	记录片百年中国	0.62
23：01	人与自然（2000-46）	0.33
23：31	军事天地（2000-45）	0.23
23：46	天涯共此时（2000-46）	0.14
00：00	新闻	0.08

表4：样本地区中央一套节目晚间实际收视率（2000年11月20日星期一）

时间	中央电视台一套栏目	抽样收视率（%）（E_r1）	乡村家庭抽样收视率(b)	实际收视率（E_r2）
18：00	新闻	1.77	2.725	2.40
18：05	广告	1.77	2.725	2.40
18：09	大风车（2000-325）	2.05	2.725	2.50
18：49	广告	2.54	3.175	2.96
19：00	新闻联播	37.94	23.375	28.32
19：35	广告	26.98	22.625	24.10
19：39	焦点访谈	23.06	22.625	22.77
19：51	广告	15.86	15.625	15.70
20：06	荣事达杯节目主持人大赛	7.99	8.825	8.54
21：51	广告	4.79	3.425	3.89
22：00	世界报道	2.75	2.125	2.34
22：17	广告	1.84	1.300	1.48
22：19	晚间新闻	1.84	1.300	1.48
22：29	广告	1.64	1.300	1.42
22：31	体育新闻	1.31	1.025	1.12
22：48	广告	0.68	0.475	0.54
22：56	记录片百年中国	0.62	0.475	0.52
23：01	人与自然（2000-46）	0.33	0.200	0.24
23：31	军事天地（2000-45）	0.23	0.175	0.19
23：46	天涯共此时（2000-46）	0.14	0.100	0.11
00：00	新闻	0.08	____	____

把表3和表4 的收视率数据表现在同一折线图上，可以发现：抽样收视率和实际收视率之间存在明显的误差，而且，实际收视率和抽样收视率之间并非呈简单的倍数关系，没有实证研究的基础，妄加估测内在的规律和本质都是不科学的，这也警醒了我们必须以一种严肃、认真的态度来对待广告的现象，才能有利于发挥广告对经济的最大激励。见图1。

图1：央视抽样收视率和实际收视率的比较（略）

3 结论

在抽样城乡家庭数与城乡人口比例不符，或设计样本与实际人口在比例上不一致时，笔者针对目前的央视收视调查样本构成状况，提供了一种分析收视问题的方法和思路，在此基础上推论出的如下的收视率换算公式，以供读者参考：

E_r2=0.3394E_r1+0.6606b （4）

E_r2-实际收视率

E_r1-抽样收视率

b-乡村家庭抽样（或实际）收视率均值

这个公式基本解决了城乡样本构成不合理的问题，而且，也利用了央视原有的收视调查数据，校正了不准确的抽样收视率数据，这是一种方法论的思考，也给我们观察周围事物提供了一条有益的线索。