档案

Archive for the ‘调查方法’ Category

定量研究只有这三种方法吗?

2012/03/13 留下评论

LZF @ 2012-02-29:

有人问我:传播学定量研究中为什么只有调查、实验和内容分析这三种方法?难道没有其它方法了吗?

庄主 @ 2012-03-12:

定量研究方法可以大致分为数据采集(data collection)、数据分析(data analysis)和数据展现(data presentation,如数据可视化手段)等三个部分。你提到的调查、实验和内容分析,属于数据采集方法。它们在传播学研究中确实占了主要地位。C. W. Trumbo曾比较了1965-2000年间传播学主要学术期刊中所使用的数据采集方法,发现35年间调查、实验和内容分析三者合计占了总体的60-65%左右(图一)。其实这个比例是低估了的。因为此外还有20-30%左右的“二手数据”(secondary data)中很多是别人收集的调查或其它数据(见以下进一步的讨论)。由此看来,调查、实验和内容分析应该占了传播学研究数据采集方法的七成(70%)左右。image

当然,还有三成左右的数据来自其它采集方法。其中最大宗的是二手数据。所谓二手数据,是由其他学者或机构为其它目的而采集的数据,被传播学者用来做“再度分析”(secondary analysis)。传播学中所用到的二手数据,大致说来可分为如下两类:

一是其他学者或机构所做的调查数据,其中最著名的如General Social Survey(SGG)、American National Election Studies(ANES)、Pew Internet and American Life(PEW)等。这些数据基本上都是全国性通过概率抽样而得的大样本,而且是定期进行的重复调查,适于纵向研究。更难得的是免费分享的。我早年在美国任教时,就曾多次得益于这些免费数据。如在一篇论文中,就免费使用了盖洛普全国调查的40余个数据(其成本应该超过一千万美元)。如上所说,这类数据其实也是调查数据,只是最初由别人收集而已。

二是政府(包括联合国)、行业协会或社会团体汇集的统计报表(statistical records),最著名的当然是人口普查、国民经济、媒体消费等年报。与第一类的个体数据不同,这些统计报表是一个国家或地区的汇总数据,多半用于时间序列分析或跨国比较研究。

以上是上世纪的“故”事了。进入21世纪以来,包括传播学在内的全球社会科学研究已经和正在发生的最重大变化,恰恰就在数据采集方法上。这是一个大话题,值得写很多篇文章。这里只用几句话简单概括一下:网络数据(如用户浏览记录、网页内容以及超链接结构等)正在成为调查、实验、内容分析、统计报表之后的第五种数据来源或采集方法。当然,在21世纪的前10年中,网络数据在传播学研究中占的比例还不大(我们正在做的一项研究中发现其大约占3-5%)。但是,我们相信在下一个10年内,网络数据将成为与调查和内容分析并驾齐驱的三架马车,而在再下一个10年(2021-30)内成为数据采集的首要方法。也许这是一个很保守的估计。

所引文献

Trumbo, C. W. (2004). Research methods in mass communication research: A census of eight
journals 1990-2000. Journalism and Mass Communication Quarterly, 81(2), 417-436.

如何从社会化媒体中抽取随机样本? How to draw random sampling from social media sites?

2011/08/21 留下评论

How to draw random samples from blogs, social networks, microbloggings and other social media sites? In an article just published in Social Science Computer Review, we presented a method,  called "Random Digit Search" (RDS), to sample users on a probability basis from one of the largest blog sites in China. The method, which is adapted from "Random Digit Dialing" (RDD) in telephone survey sampling, is generally applicable to other social media sites that assign all users with a numeric ID number. 

Zhu, J. J. H. et al. (2011). A Random Digit Search (RDS) Method for Sampling of Blogs and Other User-Generated Content. Social Science Computer Review, 29 (3), 327-339.

权衡需求理论与使用-满足理论有何异同?

2011/04/25 留下评论

YHQ @ 2011-04-23:

我看了您的论文《不同渠道、不同旋转地竞争机制:新媒体权衡需求理论》(中译稿),有点疑问和思考。

对译稿在关键概念上的翻译,我有点疑惑。“权衡需求”这一概念能否准确表达出人们选择和决定过程中的经验累积导致的认知、比较、计算和赋予某一媒介优先地位的这些含义?我认为您更为强调的是对媒介本身的需求,不是使用与满足研究所注重的社会心理需求,更注重现实中人们主动选择导致的媒介竞争情形。希望我没有错误理解。

按我的理解,您理论中的“新媒介”似乎是一个相对的概念,它可能是早期的印刷机、纸张,也可能是现在的互联网。您研究中是将互联网作为新媒介之代表与传统媒体对照,那么,我们该如何解释新媒体内部不同服务形式之间的竞争呢?比如说,博客对传统BBS社区的受众蚕食,以及现在微博对社交网站、博客网站的受众蚕食。您的研究结论表明,诸种社会差异在人们持续使用互联网上没有显著性,这是否是互联网的媒介特性或另有其他因素决定的,但是并不能说明诸种社会差异在其他媒介的选择过程中就不起作用?

我很感兴趣,冒昧致信,并请求给我一份问卷。

庄主 @ 2011-04-24:

多谢提问。其中涉及三个问题,分别简述如下。

第一、“权衡需求”与“使用与满足”之间的异同。

在最初的论文 (Zhu & He, 2002),我们把那个概念叫Perceived Need for New Media (PNNM),后来改名为Weighted and Calculated Need for New Media (WCN),但测量指标依旧,翻成中文时译为“权衡需求”(祝建华,2004)。为了便于讨论以及便于其他读者的理解,我将中文版中有关叙述及公式列在本文最后得到附录中。

我们在发展“权衡需求”这个概念时的出发点,与“使用与满足”(U&G)中的“社会和心理需求”(social and psychological needs) 相似,也是着眼于人类的基本需求(即比媒体需求更一般和广泛)。在这意义上,“权衡需求”可以说是U&G的一种新的操作版本 (a new operational version of U&G)。U&G文献中对“需求”曾有多种操作版本,如Katz的五种需求 (cognitive, affective, personal integrative, social integrative, and tension release)和McQuail的四种需求 (surveillance, diversion, personal relationship, and personal identity),它们大体相同,但也有些区别。我们考虑这些需求在互联网时代可以用六个方面来表示 (news, work-related information, personal life-related information, entertainment, companionship, and self-expression),这六项与McQuail的指标是相对应的(如,前三种需求对应surveillance,后三种分别对应diversion, personal relationship, personal identity)。

其实,我们在其后另一调查中同时测量了权衡需求的六个需求指标以及传统U&G的一组指标,用以检验两者之间的关系,结果发现相关程度很高。由于Zhu & He (2002)发表后,被不少人引用、复制或批评(SSCI期刊中至今已有20次引用),但尚无人提出上述问题(你是第一个),所以我们没有另行发表那个结果(如有机会时我也许会考虑一下)。

上面说的是权衡需求与U&G之间的相似处。当然,如我们在论文中强调的,权衡需求对U&G的修正或发展在于前者将需求作为权重(即附录公式中的W)、用来调节用户对新、旧媒体在满足六种需求的看法之间差别(即公式中的SNMij 减去SOMij),所以两者有本质区别。简单说来,U&G认为个人的需求不受任何限制,只要想到、就会去做(即使用有关媒体);权衡需求认为个人是否去实现感觉到的需求、是以对其必要性(已有媒体是否能够满足?)和可行性(新媒体是否能够满足?)的认知为前提的。如果抽象一点的说,U&G是理性和绝对化的个人主义而权衡需求是理性但受环境制约的个人主义。

第二、“权衡需求”对其它媒体是否适用?

你对“新媒体”的理解与我们的想法一样,是一个相对概念。我们2002年论文中曾所说过,PNNM在研究互联网时成为“PNI”(Perceived Need for the Internet),但其中的“I”可以被任何其他新媒体代替。2006年我与深圳大学王晓华教授在研究数码电视的前景时,就采用了这个概念(具体指标有些变化,见祝建华和王晓华,2006)。去年底,我给华中科技大学的研究生做讲座时,也给他们出了一个题,用权衡需求理论来研究blog、SNS和microblogging之间竞争关系(这也与你的想法相似)。他们已经做了调查,相信不久能见到他们发表的有关论文。

第三、“社会差异”是否有影响?

你最后的问题(诸种社会差异在人们持续使用互联网上没有显著性)中的“社会差异”指什么?我们在2002年研究中,发现有四个变量显著影响网民对互联网持续使用:权衡需求、年龄、性别、教育程度(见祝建华2004之表4)。你是指除此之外的其它个人特征(如收入)等吗?那些特征在其它新媒体的研究中也许会显著,也许不会,但对我们来说,这些都是控制变量,不作专门探讨。

最后还想回到权衡需求上来。虽然我还是觉得那个概念比现有的U&G更符合人们选择媒体的心理过程,但是其操作(即测量及计算方法)并非完美,十分欢迎你和其他读者对此提出修改建议。附录二是权衡需求概念所涉及到的18个测量指标问题原文。

所引文献

Zhu, J. J. H., & He, Z. (2002). Perceived characteristics, perceived needs, and perceived popularity: Diffusion and use of the Internet in China. Communication Research, 29 (4), 466-495.

祝建华(2004). 不同渠道、不同选择的竞争机制: 新媒体权衡需求理论.《中国传媒报告》,第8卷,第2期,第16-24页.

祝建华、王晓华 (2006). 权衡需求理论与数码电视的市场前景. 载于尹韵公、明安香(编),《传播学研究:和谐与发展》,第92-103页. 北京: 新华出版社.

附录一、权衡需求理论的表述(祝建华,2004)

权衡需求理论认为:“当且仅当受众发觉其生活中某一重要需求已经无法被传统媒体满足、而又估计某一新媒体能够满足这种需求时,人们才会开始采纳并持续使用那种新媒体。以使用互联网为例,人们只有感到传统媒体无法满足其某种需求(如表达个人意见或结识平时无缘相逢的朋友)、同时又觉得互联网有满足这种需求的能力时,才会考虑使用互联网。”用公式表示,即是

clip_image002[4]

其中,WCNi 是某人i认知到的对新媒体需求的总量,SNMij 指其对新媒体在满足某一特定需求j方面的预期满意度,SOMij 是其对传统媒体在满足需求j方面的现有实际满意度,Wij是需求j相比较于其他使用需求的重要性权数。

附录二、权衡需求测量指标问题原文

SOM. 您觉得您平时接触的报纸、广播、电视、电影等媒体是否能满足您对以下各方面的需求?[1 = 完全不满足; 2 = 大半不满足; 3 = 一半满足,一半不满足; 4 = 大半满足; 5 = 完全满足]
SOM1. 了解国内外新闻事件
SOM2. 获得有关个人生活的信息(如购物、旅游、投资、医疗健康知识)
SOM3. 获得有关工作/学习的信息(如求职、求学、提高工作或学习水平的知识和技能)
SOM4. 娱乐或个人爱好(如玩游戏、听音乐、体育消息)
SOM5. 发表个人对各种公众事物的看法、意见
SOM6. 增进感情交流 (结识新朋友、维持与已有朋友的关系)

SNM. 不管您现在是否使用互联网,您觉得互联网是否可能满足您对以下各方面的需求:[1 = 完全不满足; 2 = 大半不满足; 3 = 一半满足,一半不满足; 4 = 大半满足; 5 = 完全满足]
SNM1. 了解国内外新闻事件
SNM2. 获得有关个人生活的信息(如购物、旅游、投资、医疗健康知识)
SNM3. 获得有关工作/学习的信息(如求职、求学、提高工作或学习水平的知识和技能)
SNM4. 娱乐或个人爱好(如玩游戏、听音乐、体育消息)
SNM5. 发表个人对各种公众事物的看法、意见

W、下列需求对您来说,什么最重要,什么最不重要? [请按1 = 最重要, 2 = 次重要, … 6 = 最不重要排序]:
W1 了解国内外新闻事件
W2. 获得有关个人生活的信息(如购物、旅游、投资、医疗健康知识)
W3. 获得有关工作/学习的信息(如求职、求学、提高工作或学习水平的知识和技能)
W4. 娱乐或个人爱好(如玩游戏、听音乐、体育消息)
W5. 发表个人对各种公众事物的看法、意见
W6. 增进感情交流 (结识新朋友、维持与已有朋友的关系)

如何解读这个调查报告?

2009/08/20 留下评论

>

ANY @ 2009-08-19:

今年XX单位做了一个YY方面的调查,报告出炉后争议很大。我呢,虽没参与争议之中,因专业之故,很是关注。就我个人意见,我非常不理研究者组使用RDD法抽取了647人来代表全体北京人口,给各媒体排名。我极其质疑它使用的抽样技术。我认为非概率抽样中的配额抽样可能更适合做这个调查。

庄主 @ 2009-08-20 答: 我没看到那个报告。请进一步说明清楚,你质疑的是样本量太小、还是RDD(随机电话号码抽样)原则、或者其它问题?

你建议用配额抽样,我可以肯定地说配额抽样一定不适合。

ANY问:

我首先质疑的是调查组的抽样方法。我和研究者联系,希望得到更多细节,比如是随机拨号法,还是集群拨号法,但无法得到。 刚巧收到了回复,说:“抽样方法采用的是RDD,先通过不等概抽样(pps)确定前面四位局号,后面四位是随机选号(北京电话号码是8位),抽样是座机。”在此之前的争议中,有人怀疑的是647个样本来代表2000多万北京人的代表性。

庄主答:

你的怀疑和批判精神值得提倡。当然,如果对抽样基本原理有比较清楚的理解,则可以避免在怀疑和批判时犯常识性错误。

第一、样本大小涉及的是调查结果的精确度问题、而与代表性无关。样本越大、结果越精确,反之亦然。精确度有公式可以计算,即抽样误差。当N = 647而可信度 = 95%时,抽样误差 = ±3.8%。这个精确度是否足够?答案取决于具体的研究问题。如果被排序的两个媒体之间相差8%或更大,那么它们的高低是可靠的;反之则不然。

第二、抽样误差与总体大小无关。所以无论北京人口是2千万还是2亿,样本为647的抽样误差大小是不变的。

第三、样本的代表性取决于抽样是否随机、而与样本大小无关。如果一个非随机样本N=10000,虽然其抽样误差 < ±1.0%,但仍然没有代表性。一个没有代表性的大样本比一个精确度低的小样本更无价值。

ANY问:如果是抽取座机号码的话,我现在也高度怀疑样本的代表性。因为有很多在北京的人,终其一生不用座机。据经验推测的话,许多有北京户口的人也不见得使用座机。而上一次人口普查是把大量北漂计入了北京人口的。把大量无座机电话的人排除在总体之外,这意味着什么呢?而这是为什么我觉得配额抽样更好的缘故。

庄主答:

同意。如果上述调查的RDD是严格执行的话,那么其代表的是北京有座机的家庭人口。也就是说,该调查的Study Population(研究总体)是北京有座机的家庭人口、而不是北京所有家庭人口。研究者在报告时应该说明这一点。当然,研究总体限于“北京有座机的家庭人口”的一个调查是否有价值,即取决于其与北京所有家庭人口之比(你知道到底有多少人被排除之外的吗?)、也取决于研究目的。如果有关媒体(或广告商)更关心有座机家庭人口,那么也是无可非议的。商业调查毕竟不是民意测量。

配额抽样不是随机抽样,调查结果毫无价值。现在考考你:为什么配额不是随机抽样?

ANY问:

研究者用盖洛普1932年用1000个样本代表美国人预测了总统选举来证明其647人样本有代表性。我觉得这是个外行的支持。

庄主答:

你觉得我上面的回答是否已经解决了这个问题?如无,我再啰嗦几句。

ANY问:

问卷是看不到的。我个人看法,即使是RDD法,考虑分众化和个人媒介使用的多样性,问卷设计应当是一套很复杂的问卷。

庄主答:

抽样、问卷设计和调查(即问答过程)代表了每项调查的三个主要误差来源:抽样误差、工具误差和测量误差。每一项都要小心处理,并应在报告(或技术附件中)详细透露。如抽样方法、问卷原文、调查过程(尤其是最后一步的个人是如何被抽取的),以便读者对其研究结果的质量作出自己的判断。

ANY问:

我的问题纯出于专业上的兴趣。我非常想弄清楚这个问题。再次感谢您!

庄主答:

我是出于同样的原因而回答你的问题。

分类:论文写作, 调查方法 标签: