首页 > 心得体会 > 学习材料 / 正文

中文网络学术社区用户会话交互模式及其交互质量研究

2023-03-04 14:40:15 ℃

张敏，姜冠兰，丁恒

（1. 华中师范大学信息管理学院，武汉 430079；
2. 西南大学计算机与信息科学学院，重庆 400715）

在“互联网+”时代，人类科学活动模式面临新的变革。传统的科学结构、研究过程、交流方式与价值体系都被置于新的网络开放环境之中。21世纪初，Academia.edu、ResearchGate、Mendeley和小木虫等优秀学术社区的创立，为科研人员提供了全新的互动领域。学术社区用户以提问、回答会话交互方式，就某一特定问题的持续讨论拓展了学术交流的深度，促进学术知识共享，为相关领域发展奠定学术知识基础。

交互通常被理解为“需要至少两个对象和两个动作的相互事件，这两个物体和事件相互影响时，就会发生相互作用”[1]。LIS（library and informa‐tion science）领域早期聚焦信息查询者与信息系统之间的交互研究，同时关注信息查询者与中介代理者（如图书馆参考馆员）之间的问题协商交互过程，这类研究考察了代理者如何与用户协商查询术语，以及在查询过程中图书馆员和用户的角色。随后，相关研究扩展至更宽泛的信息系统环境中的人机交互及人际沟通研究[2]。随着搜索引擎和网络社区的发展，问答服务和在线讨论论坛的快速发展促进了用户会话交互研究发展，这种会话交互是基于计算机协调的多人之间非正式交流，相关研究借鉴了面对面对话中蕴含的语言特征和副语言特征（如面部表情等），借助用户会话行为的客观指标，探究用户会话问题特征、回答质量等问题。还有学者利用参与会话线程的用户数量、话轮次数探究会话结构特征，或通过小样本会话文本数据定性编码以探究会话模式。现有研究较少针对会话交互过程，以及自动抽取与挖掘分析用户会话序列结构，未能完整反映会话成员针对某一议题形成和发展知识的建构过程。

伴随学者们越来越多地参与到网络学术社区交互，识别其中会话交互模式，探究会话交互本质具有重要的意义。本研究选取小木虫论坛进行实证分析，在用户会话行为和会话内容定性编码的基础上，通过R语言抽取用户的会话交互序列结构，自动聚类出用户典型会话模式，继而从知识形成与发展的建构过程探究会话交互的质量特征，重点探索以下问题：①学术社区中用户会话交互行为的整体分布状况如何？②学术社区用户会话交互行为序列有哪些？主要的会话模式是什么？③会话交互质量水平如何？④不同会话模式的交互质量水平有何差异？是否受会话长度的影响？本研究有助于深入理解网络学术社区用户会话交互的规律，以增强开放领域问答系统互动性设计，提高用户生成内容的共享效率，增强用户黏性，促进学术社区健康持续发展。

相关研究主要集中在网络学术社区用户交互行为类型及交互关系、交互内容、交互模式与质量等方面。

（1）会话交互行为类型及交互关系研究。网络学术社区用户的会话交互行为目前还没有一致的定义与划分标准。学者们按照用户参与程度，将其划分为发帖行为、回帖行为和浏览行为[3-4]。根据用户对平台功能的使用，划分出分享、检索、阅读、评论和推荐等行为[5]。按照用户交互目的，划分出利用行为、交互及合作行为[6]等。此外，研究者还常常通过社区的链接关系、回复关系、好友关系、会话关系等数据构建社群网络，以分析用户交互结构特征[7-8]。这些研究从行为学视角刻画了学术社区用户细粒度的交互行为特征和关系模式，不足之处在于其割裂了某一议题的意义，不能够完整反映整个会话过程交互特征。

（2）会话交互内容研究。学者们将用户会话划分为提问内容和回答内容两个部分，根据具体会话内容进一步编码为事实信息、意见和建议等主要类型。例如，Deng等[9]将学术社区中用户提问分为信息型、意见型、建议型，并指出用户更倾向于获取事实知识，表达看法、提供事实信息和提供建议是最常见的回帖内容；
卢恒等[10]发现小木虫论坛用户的交互内容分为任务信息类和社交情感类，以学术任务类信息交互为主。这类研究重点在于从会话内容探究用户参与动机，较少涉及群体用户之间问题解决的会话交互机理。

（3）会话交互模式研究。针对会话过程迁移演化、话轮转换等层面的少量研究目前集中于微信用户群[11]、在线医疗平台[12]、在线健康社区[1]等研究情境。例如，李月琳等[12]针对在线健康医疗平台用户与医生交互模式，采用开放编码和会话分析相结合的方法，总结了直线式和螺旋式两种会话交互模式，发现了用户医疗信息需求描述、交互负荷、表达方式、知识势能差等影响交互效率的关键因素；
Savolainen[1]总结了糖尿病论坛的4种会话模式等。此类现有研究主要通过小样本的会话文本数据定性编码完成，未涉及会话序列结构的自动抽取探索，也未见针对会话长度对会话质量的影响关系探讨。

（4）会话交互质量研究。围绕用户评论质量、回答质量、知识交流效率等，学者们构建了文本内容、用户特征、平台特征、声望影响等维度指标，通过内容分析、描述性统计分析、机器学习等方法进行会话交互质量的评价及预测（表1）。例如，丁敬达等[13]从声望、受众和影响3个方面的客观数据特征入手，发现用户评论及评论频次等交互指标能够反映学术博客的质量。总体而言，现有会话交互质量研究主要通过答案数量、RG分数（Research‐Gate score）等客观指标进行评价，对会话过程中知识细化、整合、反思及迁移应用的知识建构过程的挖掘与呈现还不够重视，未能体现用户知识交互深度的现状。

表1 网络学术社区会话交互质量评价相关研究

总体而言，现有相关研究较偏重于从行为学视角刻画学术社区用户会话行为分布特征和关系模式。将基于议题的会话互动作为分析单元、探讨用户交互行为序列以及会话模式研究较少，不同会话交互序列的知识建构水平研究也较为缺乏。

3.1 数据来源与获取

本研究以小木虫论坛作为数据采集平台，选择了如表2所示的5个学科（专业）版块的数据进行分析。按照《中华人民共和国学科分类与代码国家标准》（GB/T 13745-2009）一级学科的分类方式，这5个版块覆盖了4个学科门类。其中，小木虫人文社科以大类命名，并未做细致的学科划分，主要包括中外史学、地理人文、宗教哲学等具体的交流主题。选取小木虫论坛作为数据来源的主要原因包括：①该论坛是中国最活跃的学术科研互动社区之一，拥有2700万用户积累，所选择的5个学科（专业）板块具有较高活跃性，发帖类型多样，可保证所获取用户会话交互数据丰富，能完整覆盖本研究编码方案所涉及的数据维度；
②作为综合性的网络学术社区，所选择的学科（专业）板块代表了成熟的基础学科、应用学科，以及新兴交叉学科或跨学科领域，有助于对比各学科用户会话交互行为差异，得出更加全面的结论。

表2 数据收集结果统计表

本研究于2020年12月利用八爪鱼数据采集器完成了数据自动收集，采集了各学科版块最近6个月的发/回帖数据，数据收集结果如表2所示。

3.2 数据分析与编码方案制定

本研究基于会话分析理论剖析小木虫论坛中用户会话交互行为类型及序列结构。会话分析理论（conversation analysis theory）是一种社会学的言语行为研究理论，始于20世纪60年代社会学家收集自然发生的真实会话语料所进行的分析，旨在揭示人们之间互动行为的内在组织结构，从中发现人类言语交际的规律和模式，并解释其中隐含的社会秩序和社会规律[19]。Wang等[20]和Savolainen[1]认为在线讨论社区会话交互核心功能是提问和回答，代表着用户信息查询与共享需求；
进一步区分会话发起者和参与者的不同角色，提出会话交互行为概念框架。本研究借鉴了Savolainen[1]会话行为分类编码方案，并以此为基础从纵向角度挖掘发现会话交互序列结构和交互模式（表3）。

表3 网络学术社区用户会话交互行为编码方案

为进一步探讨用户会话交互质量，本研究借鉴Harasim的协同知识建构理论[21]以及社会交互分析模型IAM（interaction analysis model）[22]等，同时综合考虑学术社区的特征[23]形成会话交互质量编码方案（表4），以社区成员的知识发散、知识联结和知识收敛3个阶段为标志，反映参与者通过对话交互最终共同完成知识建构的过程。在学术社区中，用户通过提出问题，协商、反复讨论并持续对观点和解决思路进行修正，逐步达到收敛和一致，最终实现对问题的理解或解决，并通过内化迁移实现个体或社区群体知识建构。本研究按照知识建构的3个层级对会话序列进行不同分值赋值，转化为知识建构的质量水平，分值越高，代表知识建构水平越高（层级越深）。

表4 网络学术社区用户交互质量分析编码框架（知识建构层次）

续表

为了保证编码方案与研究数据的匹配性和有效性，本研究首先选择无机非金属学科板块进行人工编码，经过编码实践论证，进行了适当调整，形成最终版本，如表3、表4所示。一个学科板块编码完成后，再扩展至其他学科板块。本研究采用了多种人工编码方式。由于样本数量较大，编码主要由1位主编码员完成。Miles等[24]认为，在进行内容分析编码时，单独的研究人员可以重复对数据进行编码，直到编码的一致性达到90%，以保证可信度。本研究按照这个规则进行单人多轮次编码，直到重复测量的Co‐hen"s kappa系数达到90%。在编码的过程中若发现有歧义的地方，则采用双人或三人编码形式，与交互行为和知识建构理论的两位专家进行讨论交流，直到达成最终共识。图1为本研究的整体研究框架。

图1 本研究的整体研究框架

通过数据清洗，删除因屏蔽无法获取具体提问内容的帖子，以及仅分享信息而不提问的发帖，最后共得到1485条主帖记录，其中无机非金属最多（N=609），其次分别为量子化学（N=311）、人文社科（N=256）、医学（N=201），信息科学发帖最少（N=108）；
同时包含7099条有效回帖数据。在此基础上进行编码统计分析。

4.1 会话交互行为的分布特征

依据会话行为编码方案，按照会话意义单元对帖子信息内容进行编码，一个单独的帖子可能包含一个或多个会话行为，对每个会话单元都通过适当的代码，如IA、PAQ等进行识别。对所有数据进行编码后，1485个初始问题（即主贴）共计发生8681个会话行为，总体分布情况如表5所示。

表5 各学科用户会话交互行为的类型分布

统计分析结果显示，网络学术社区会话行为以回答相关行为（IA、ICA、PCA）为主，占所有会话行为的62.73%，提问相关行为（IQ、PAQ、IAQ）占36.39%。相比于糖尿病论坛26%提问比例[1]，学术社区显示了更高的提问需求。提问行为在不同讨论组别中有所差异，其中量子化学用户提问相关行为占比高达50.74%，涉及交叉学科面临的复杂技术操作性问题、理论方法问题、研究方向选择等信息需求。回答相关的行为中，学术社区中初始回答最为常见，占所有会话行为的43.57%，参与者补充回答的比例为8.80%，显示了学术社区用户信息共享的旺盛需求。

进一步探讨不同学科会话行为的差异，对5个学科的会话行为进行卡方检验，结果表明存在显著差异（χ2=496.398，P＜0.001）。具体来说，医学和人文社科的初始回答行为显著高于其他学科，一定程度上表明这两个学科大部分参与者都只进行一次基本回复。可能的原因是这两个板块未进一步细分学科，用户所讨论的问题比较宽泛，较多涉及经验分享，如提问：读博计划、请分享你的抗疫心路历程等，针对具体学术议题展开深入交流比例较小。工科用户显示双向互动更为频繁，交互层次更深入。例如，信息科学参与者更喜欢对自身或他人的回答进行补充（16.49%）；
无机非金属学科话题发起者追加提问比例（4.20%）更高；
量子化学参与者更积极向其他用户追加提问（25.74%），吸引发起者补充回答的比例也更高（11.22%）。证实了已有相关研究发现，即理工科的科研人员相对于人文学科学者更青睐网络学术社区，在社区交互方面更为活跃[25]。

总体而言，学术社区用户提出质疑的比例较低，同人文社科学者相比，理工科学者对答案质疑比例更低，可能是人文学科学者重思想辩论，而理工科类讨论话题往往聚焦于具体问题的解决，如针对概念事实和实验方法的恰当解释，而这些问题往往都是有明确答案的。

4.2 会话交互行为序列结构及交互模式分析

网络学术社区中会话交互行为并不是表面看上去的随意、杂乱无序，而是有规律可循，这种规律性不是研究者虚构出来的，而是会话参与者在交往中受一定的规范指引形成的[26]。以往研究多依靠质性分析进行小样本量会话内容的探索性分析[1]，本研究引入序列分析工具TraMineR，根据用户会话行为编码数据，从中抽取会话序列结构，以挖掘发现学术用户会话交互规律。

序列分析最早应用于确定DNA（deoxyribonu‐cleic acid）上核苷酸排列的顺序，目前被广泛应用于社会学、心理学、生命历程研究和时间利用研究等领域，是研究用户行为规律、挖掘潜在行为模式的重要方法之一。TraMineR是进行序列分析的常见工具之一，是日内瓦大学人口与社会经济学研究所开发的免费开源R语言包[27]，可用于社会科学领域序列数据的挖掘、描述和可视化[28-29]。

4.2.1 高频会话序列分析

本研究将每一个帖子都看成一个会话线程，按照会话在帖子中出现的先后排列，形成一个特定序列，每一个序列都由初始问题IQ引发其他的会话行为，如“初始问题（IQ）→初始回答（IA）→发起者附加问题（IAQ）……”统计分析发现，在全部1485个线程中，最短的序列为1，即只包含问题的序列；
最长的序列中包含了355个会话行为，平均会话长度为5.8。图2统计显示了1485个线程中出现频率最高的前20个序列，其中X轴表示在整个交互序列中各会话行为出现位置，例如，X1代表第1个会话行为，即初始问题IQ，X2代表第2个会话行为，以此类推。Y轴则显示了序列出现的累积频率百分比，这20个序列出现频率约占总样本的64%。

图2分析显示，小木虫社区出现最频繁的序列是IQ（初始提问），占25.9%，即1485个会话序列中有1/4是只有一个初始提问而没有回答的序列。经内容分析发现这些问题60%以上由新用户发布，大部分会话是为了查找客观事实信息，如书籍资料、软件安装包和一些具有确定答案的问题，例如，“大家好！哪位老师有《无机材料合成方法》的视频课件，麻烦给我发一份”。这类任务型问题往往在特定的分区能找到解答。Sin等[28]针对计算机技术问答网站会话交互的研究同样发现，空序列占比高达48.6%。其次最常见的序列是IQ→IA和IQ→IA→IA序列，即初始提问之后只收到一个和两个初始回答的序列占比为14.8%和5.4%。第4个常见序列是IQ→PAQ（参与者追加提问），即除初始问题外，第一个参与者向发起者提出了一个附加问题的行为序列占3.6%。第5个常见序列为IQ→IA→ICA（发起者补充回答），即初始提问和初始回答之后，发起者又进行了补充回答，发起者和参与者之间完成了一次简短的交互，该类行为序列占2.6%。

图2 高频会话交互行为序列（彩图请见https://qbxb.istic.ac.cn/）

4.2.2 会话交互模式分析

为了探究学术社区整体的会话序列特征，本研究对所有的会话序列进行聚类，以确定代表性序列。通过TraMineR计算最佳匹配矩阵，最佳匹配（the optimal matching，OM）分析是一种计算序列之间相似性的常用方法[30]。随后使用ward方法进行层次聚类分析，并根据聚类评估选择合适的聚类数量。Savolainen[31]针对DIY（do it yourself）社区会话行为的研究指出，虽然一些帖子中有较多会话行为，产生了较长序列，但是后半部分的内容中会话结构变得单一，余下的内容不会给研究结果增加太多新内容。本研究分析发现，1485条主贴中，只有10条主贴超过了100条会话，且这些长帖多为交流、调研某一现象，如“为什么选计算化学”“女生为了事业而放弃爱情和家庭，值得吗？”少数帖子回复量较高，导致整体会话序列长度差异较大。为了使聚类结果更具有代表性，本研究最多截取每个帖子的前100条会话行为进行分析。

通过对1485个会话线程进行聚类分析，最终得出5个聚类类别，分别从5个聚类中抽取代表性序列，如图3所示。参照Wang等[20]、Savolainen[1]等按照会话行为的顺序组合成会话序列的观点，根据每个代表性序列包含的会话行为类型、会话行为的转换，最终构成以问答方式表现的有意义的会话行为模式，总结出网络学术社区中用户会话交互模式主要包括问题澄清、简单问答、回答扩充、问题协商。下文结合实例进行讨论。

图3 5个聚类中选取的代表性序列(彩图请见https://qbxb.istic.ac.cn/)

1）聚类1：问题澄清模式

聚类1（n=511）代表序列表现为IQ-PAQ（参与者追加提问），该模式平均会话长度为1.43，是5个聚类中最短的代表序列。其典型情况是，发起者在提出问题后，得到的第1个回答不是针对问题的解决方式，而是参与者直接提出追加问题，请求阐明初始问题中的细节或提出其他延伸问题。如下面这个例子中，提问者想要买一些专业书籍，在论坛请求他人推荐：

请问买一些信息科学方面的经典书目，求推荐，谢谢！（I92-IQ）

具体是想做啥？面太宽就不好推荐（I92-PAQ）

在这个问题中，由于提问内容不清晰，参与者请求对问题做进一步的说明，但未得到继续响应，因此该会话以这样一个提问结束。

2）聚类2：简单问答模式

聚类2仅包含8个样本，是5个聚类中最小的集群，即线程较长但结构相对单一的会话模式：IQIA-IA-…PCA-IA-…IA…，主要由社区中部分热门的帖子构成，整个序列由参与者积极参与初始回答形成，但较多参与者仅产生一次初始回答行为，并不能支配整个交互。例如，在信息科学中一个用户提出问题“手机硬件的下一步的发展方向在哪？”这个帖子共计发生116个会话行为，其中初始回答（IA）行为共计95条，在这个帖子中，会话发起者主要是想调研或与他人交流对某一主题的看法，而不是解决问题，很少发生更进一步的循环交互。由于这一聚类包含样本过少，说明这一会话模式在社区中并不常见，本研究未将其归为代表性序列加以后续分析。

3）聚类3、聚类5：问题协商模式

聚类3（n=320）代表性序列由IQ-IA（初始回答）-IAQ（发起者追加提问）-PCA（参与者补充回答）-PAQ（参与者追加提问）等构成，例如：

实验室有聚乙烯醇分子量75000～79000，还有聚乙二醇2000和800的，因为之前陶瓷粉干压后，总是掉粉，烧成后，也是爱断层。想用粘合剂，用哪种呢，怎样用呢？（IN137-IQ）

文献中都说用的是PVA，但具体聚合度很少提及。加入量为1.5%～2%，不过加了后烧结前要增加脱脂工序的（IN137-IA）。为什么要脱脂呢（IN137-IAQ），怎么脱脂呀？（IN137-IAQ）非常感谢！

加了粘结剂，是为了有利于成型，但它若不除去会对材料产生杂质污染，影响最终性能与使用……在坯料内外气孔通道封闭前将粘结剂全部清除。（IN137-PCA）

你好，那怎么判断脱脂的程度呢？（IN137-PAQ）粘结剂的残留量怎么测呢？（IN137-PAQ）

这可能就要反复测试每个脱脂温度对应的烧结体中的残碳量来决定最佳的脱脂温度了。（IN137-PCA）

这个例子代表了一个问答交互的实例，发起者与参与者一问一答的交替使问题逐步明晰，并得到更多有用的回答。此外，由于社区的开放性，会话的过程并不完全是发起者与参与者的交互，也可能是参与者之间的交互。在上述例子中的后半部分，参与者对发起者的追加问题进行补充回答之后，又与其他参与者进行了问答交互，Wang等[20]指出，回答问题的参与者之间的讨论，有助于有效地进行知识的分享与传递。

聚类5（n=462）的代表序列由IQ-IA（初始回答）-ICA（发起者补充回答）-PAQ（参与者追加提问）-ICA-PAQ交替构成，该序列和聚类3相似，都有完整的发起者与参与者的问答交互，表现出更明显的回答与追加提问交替的过程，并且主要以参与者提问、发起者回答的形式完成。

这两种序列可以归纳为问题协商模式，平均会话长度为4.89，典型特征是最初的问题和答案之后是一系列补充回答和追加提问，问题和回答交替可以为用户提供更加详细的解决方案。

4）聚类4：回答扩充模式

聚类4（n=184）的代表序列为IQ-IA（初始回答）-ICA（发起者补充回答）-IA-PCA（参与者补充回答）-IA-IA-IA-IA-IA，平均会话长度为14.30。聚类4中包含更多的回答行为，包括初始回答和附加回答，前半部分发起者与参与者进行补充回答交互（IA-ICA-IA-PCA），后半部分则主要由初始回答构成。这种模式可以归纳为回答扩充型模式，在初始的回答行为之后由一系列补充回答形成，这些补充回答是基于前述回答的详细阐释，以及对问题的逐步细化。例如：

圆盘造粒机，生坯球形度不高……是不是加水或加粉方式及用量存在问题。（IN57-IQ）之前我试验过40-70目的，关键点在这几点：……（IN57-IA）

谢谢回复。喷壶我已经做出调整，喷出来的水相比之前雾化效果更好，但是肯定达不到3μm。另外，我试过如果水喷得少的话，生坯球可能不够致密，轻轻一搓就会散掉，这也是个问题。（IN57-ICA）

试着每次喷水后转时间长，少喷水，多转。另外这个跟个人熟练程度有很大关系。老师傅做得确实比较好。所以需要不断积累经验，掌握料、水、时间的最佳关系点。这个量化标准不好衡量。（IN57-PCA）

这种会话序列通过一系列补充回答对最初的回答进行提炼或扩充，可能会提出更加有针对性的解决方案，往往是对问题的某一点进行的详细解析，有利于解决发起者的问题。

会话分析理论认为，一次完整的会话通常由启动、展开和结束这3个部分构成[32]。在实际的对话交互中，一个完整的会话线程通常不会只由一种单一的序列结构组成，会话越长，越有可能出现多种序列交织。由于学术社区是自由开放的，会话过程整体较为自由松散，话题的转换也较为随意，会话可能随时中断，也可能历经较长时间之后由其他用户“唤醒”，继续中止前的阶段。

4.3 会话交互质量分析

4.3.1 学术社区用户知识建构层次及结构分析

根据交互质量编码方案对7099条回帖文本进行分析编码。统计结果显示，小木虫社区用户知识发散阶段的回帖共5317条，占总回帖的74.90%。这一层次的交互特征主要是回帖者简单表明对问题或其他回帖的态度或感受，如“赞同”“谢谢”等；
或是简单地提出疑问，如“同求”“这个问题楼主解决了吗”等；
或是简单提出观点，但不对观点进行阐释，如“BN耐火材料应该可以”“烧结制度可以调整一下看”。

知识联结阶段的回帖共计1528条，占21.50%。主要是对其他用户的观点进行评价回复，相互分享信息和观点，通过提出相关问题和解答问题相互进行观点的意义协商，结合不同观点深化自身对问题的认识。例如，在归纳整合层次，针对氧化锆陶瓷抛光的问题，一个回帖者做出如下回复：“氧化锆陶瓷抛光过程中，如果应力过大，有可能晶粒脱落产生坑点的，其实可以从坑点的晶粒形态分析，如果是那种棱角分明的情况，基本可以认为是有晶粒脱落造成的，那种烧结不致密残留的孔洞的边缘应该不会有那种明显的棱角的。”回帖者能够提出自身观点，并从多方面分析问题，把各自的观点联系起来，将许多零散的观点汇聚成一个较大的观点，个人的理解也逐步加深。

知识收敛阶段文本共254条，占3.60%。在学术社区较少发生，这个层次的会话交互主要是用户对与自身观点有矛盾冲突的地方提出质疑，或在原有观点的基础上受到其他用户观点的启发，对过程、结果等进行总结和反思，实现对问题的理解和解决，各种观点的联结和结合点已经被辨别出来，参与会话成员基于共享知识的理解进行知识建构。其中，101条回帖显示用户能对某些观点提出质疑或指出其错误，这说明参与用户能对帖子内容进行仔细阅读和思考，如“您的话我看懂了，但是您说的有错误。您说‘高斯软件计算出来的分子轨道图中成键轨道和反键轨道的颜色是不一样的’，我很负责任地告诉您，那是波函数的相位，与成键轨道和反键轨道并无直接关系。请不要追问我什么是波函数的相位”。有137条回复处于深入思考阶段，参与者根据自身经验和相关资料，提出全面详细的个人观点、看法和建议。例如，针对一位用户使用圆盘造粒机出现生坯球形度不高的问题，一位参与者根据自己以往的经验提出6条建议，分别是“水量问题、生球强度的提高、母球的筛分、矾土的可塑性、制粒锅的内壁光滑程度和转速、做颗粒的顺序”，并且每条建议都给出了相应的解释。仅16条回复达到内化迁移层次，如关于某软件在使用中出现的问题，参与者通过理解和吸收他人提出的观点与建议，将其与自身的实际情况结合，实现了对问题的解决，并对自己的学习过程进行思考总结，编码示例如表4中的D3所示。

由于非正式学术交流的开放性以及学科领域的复杂性，学术社区用户交互主题呈现高度分散特征，用户的知识建构多处于知识发散和联结层次，表现为针对提问或回帖进行思考回应，依据自身知识和经验提出个人观点，较少进行批判性思考及明确表达一致观点，整个社区的知识收敛还处于潜在发展状态，即针对某一问题参与的用户增进了相互的共享理解而不一定达到观点收敛。

交互与认知理论认为，会话的过程结构与会话产生的认知表征之间存在对应关系[20]，学术社区用户参与会话交互的行为过程实际也伴随着知识建构的认知过程。在会话启动阶段，用户通过初始提问、问题解释与澄清，达到浅层的知识领会；
有些会话进入展开阶段，有些由于交互程度有限而直接进入中止阶段。在会话进入回答扩充和问题协商模式后，用户通过意义协商、观点的归纳整合，深化了认识，少部分用户通过分析质疑、深入思考，完成了知识内化迁移应用。用户知识建构过程也是循环往复、螺旋上升的，只有经过周而复始的迭代，用户才能加深对问题的理解，社区的集体智慧也才能上升到一个更高的层次。本研究结合会话交互行为序列和认知建构阶段归纳了网络学术社区知识建构的整体结构特征，如图4所示。

图4 网络学术社区知识建构过程的整体结构

4.3.2 各学科交互知识建构质量差异分析

对5个学科的不同交互质量层次的回帖数据进行卡方检验，结果表明各学科存在显著差异（χ2=179.578，P＜0.001），具体分布如图5所示。

图5 各学科交互质量层级的分布统计

具体而言，在知识发散阶段，医学有68.67%的内容处于浅层领会的层次，通过内容分析发现可能的原因在于小木虫医学版块的特殊性，其存在部分健康信息查询问题，这部分发帖往往能引起较多回答者对自身健康经历的分享，但是大部分都是对自身经历的简单描述，缺乏对医学专业问题的探索和对信息的深加工。在知识联结阶段，可以看出大部分回复都集中在意义协商层次，无机非金属、量子化学、信息科学的意义协商比例明显高于医学和人文社科，显示理工科用户会通过更多的互动交流展开对问题的探讨，不仅进行单向的知识传播，还更加注重双向的知识建构。在知识收敛阶段，虽然这一阶段在各学科中占比都较小，但是从图5仍然可以看出量子化学中处于深入思考和内化迁移层次的回复明显高于其他学科，显示这一新兴交叉学科用户呈现出能够使自己不断审视、反思自身想法、思考与对比其他学者的意见、不断去完善自我认知的意愿。

交互质量等级属于定性分类变量，而卡方检验只能了解各层次回帖的分布差异，不利于对各分类之间的交互质量进行定量对比。本研究在已有定性变量的基础上计算了每个发帖的交互质量水平，具体计算方式为：首先对知识发散、联结和收敛回帖分别赋值为1、3、5权值，其次用不同的交互质量等级乘以对应等级的回帖数量的总和，再除以每个帖子的回帖总量。如帖子IN13的知识发散交互数量是1条，联结交互数量是3条，收敛交互数量是1条，该帖的交互质量水平=(1×1+3×3+1×5)/5=3。

将交互层级转化为交互质量水平之后，本研究进一步探究不同学科的交互质量水平差异，经检验，本研究数据不符合正态分布，采用不要求数据呈正态分布的Kruskal-Wallis H检验方法来进行分析，分析结果如表6所示。量子化学（M=1.45）交互质量水平最高，其次为无机非金属（M=1.24）和信息科学（M=1.03），然后是人文社科（M=0.85）与医学（M=0.79）。各学科交互质量水平存在显著差异（P＜0.001），无机非金属与量子化学显著大于医学和人文社科。

表6 各学科交互质量水平差异分析

4.4 各会话交互模式的交互质量水平差异分析

用户之间的会话交互模式可能会影响整个会话线程的结果，采用Kruskal-Wallis H检验方法来进行分析，结果显示，各交互模式之间的质量水平存在显著差异（χ2=727.635，P＜0.001），进一步查看成对比较结果，如表7所示，3类主要的会话交互模式之间均存在显著差异。

表7 各交互模式的交互质量水平差异分析

数据分析结果显示，问题澄清模式（M=0.29）的交互质量水平显著低于问题协商模式（M=1.29）和回答扩充模式（M=1.28）。问题澄清模式由于用户问题表达不够清晰，导致问题识别和理解形成低效率的会话模式，未能展开有效的知识建构。回答扩充和问题协商模式的交互质量水平相比于问题澄清更高，表明用户对初始问题和回答的补充信息更有可能产生有用的知识[20]，更复杂和多样化的协商过程可能带来更多不同的观点和建议碰撞[28]。由此可见，在学术社区中更复杂多样的会话模式具有更高的交互质量水平。

以往研究指出，长序列会话交互质量更好[28,33]，但较少同时考虑会话长度和会话交互模式对会话质量的影响。本研究利用SPSSAU软件按照不同的交互模式构建了分组回归模型，进一步探究不同交互模式对会话长度与交互质量水平关系的调节作用，如表8所示。

回归分析的结果（表8）显示，在问题澄清和回答扩充两种会话模式中，会话长度均对交互质量水平产生促进作用。此外，问题澄清模式中会话长度的回归系数为0.423，明显大于回答扩充模式中的回归系数0.006。进一步对两种模式的回归系数进行差异分析，结果显示存在显著差异（t=27.986，P＜0.001），说明问题澄清模式相比于回答扩充模式更容易受会话长度的影响。而在问题协商模式下，会话长度对交互质量水平的影响不显著，说明更复杂和多样化的协商过程可能提高知识建构的效率，问题协商模式中混杂的对立和混合的观点对提问者来说是有益的，因为这种互相反驳、论证有利于提问者更快找到可信的答案[34]。

表8 会话长度与交互质量水平的回归分析（各交互模型分组回归结果）

根据表7的分析结果可知，不同会话模式的知识建构水平存在显著差异。本研究进一步利用Kruskal-Wallis H检验对会话模式交互数量展开分析，结果显示，不同交互模式的回复量、有效回复、浏览量等交互数量也存在显著差异（表9）。学术社区中回答扩充型的会话模式能够带来更广泛的围观和直接参与，而问题澄清模式则不然，说明不同会话模式对网络学术社区用户的整体知识建构广度、深度起着不同作用。

表9 各会话交互模式的交互数量差异分析

4.5 研究发现与讨论

本研究不同于传统的互惠、偏好依附[20]等行为互动视角，将会话行为和认知表征结合，按照“行为编码-序列抽取-会话模式总结-知识建构”的逻辑顺序，探讨了网络学术社区用户会话交互模式和知识建构关系，得出以下结论。

（1）学术社区用户通过提问和回答交替方式共享知识和经验。泰勒的问题协商理论指出，最初的问题并不总是恰当地反映出个人本能需求，需要通过额外的努力来发现更深的需求[35]。学术社区用户会话交互同样是问题协商的过程，帮助用户在提问与回答交互中找到解决问题的方法。整体而言，初始回答行为占比较大，提问比例相对于其他类型社区也更高，特别是以量子化学为代表的交叉学科在应对复杂理论与技术问题挑战时表现出更旺盛的信息查询与共享的需求。不同学科会话交互行为呈现差异性。

相比于健康社区用户（如糖尿病论坛用户），学术社区用户多轮往复的螺旋式会话交互相对较少，可能是不同问题类型及需求表达方式造成了健康信息用户与学术信息用户会话交互的行为差异。Jeong[36]的研究发现，围绕冲突观点展开的会话交互能促进更多的讨论和批判性思考，而小木虫学术社区用户更倾向于寻求问题解决的纵向会话交互，质疑、反思等横向会话交互还较为有限[4]。

（2）本研究基于会话交互行为的序列位置顺序编码，自动聚类抽取了会话交互的典型序列结构，在内容分析基础上归纳总结了学术社区3种主要的会话交互行为模式。其中问题澄清模式出现频率最多，要求发起者对问题的细节进行补充说明，常常以问题结束会话；
问题协商模式中提问和回答的交替使用户之间的交互潜力得到最大发挥；
回答扩充模式，发起者和参与者相互补充和阐释问题相关信息，有利于问题得到更详细和更集中的解决。

会话序列是会话分析研究的核心原则和决定性特征。已有的会话模式相关研究中，学者们多采用小样本量文本手工编码进行探索性分析，Savolainen[1]总结糖尿病论坛会话行为序列时归纳出提问-回答、问题澄清、加强答案、提问-回答交互4种会话模式，其中提问-回答是最基础的交互模式，尤其针对定义良好的初始问题最有帮助。本研究聚类分析结果显示，问题澄清系列聚类样本数最多，可见用户提问需求的清晰表达是会话模式形成的关键性影响因素；
针对问题协商、回答扩充模式的内容分析发现，线程发起者在序列后端更活跃的参与交互，以及会话参与者更多的引用问题会引导会话交互序列的纵深发展。

和问题探究式的课堂会话模式相比[33]，虽然课堂会话由老师主导并且精心设计流程，可能产生螺旋上升的知识建构过程，而学术社区氛围宽松，用户参与自由度更大，更多弱连接用户参与带来不同的视角，更有利于各学科用户合作进行跨学科知识建构，为用户多角度探索问题和创新思考提供了更多可能性。与学术会议小组讨论的问题协商[37]相比，在学术社区这种非正式交流情境中提问和回答并不是一一对应的，用户间的互动更为随意，会话的走向难以把控，主要由问题需求表达及交互模式推动。彭雪[37]认为，学术会议会话结构体现机构组织特征，会话序列结构变化是参与者建构专家、研究者和教师等多重身份的动态过程，受交际语境制约。小木虫学术社区由于用户身份匿名，无法利用现实“晕轮”效应，专家级用户无法在其中巩固现实学术身份以提高学术影响，表现为用户现实身份在推动会话序列结构变化中的作用有限，会话交互模式演变更取决于问题类型、定义和用户交互过程。

（3）在交互质量方面，社会建构主义理论认为知识建构本质上是合作的，通常由对话触发。本研究基于交互行为和知识建构的双重编码统计，总结中文网络学术社区交互质量的主要特征是：①会话交互只有极少部分发展到了知识收敛阶段，与在线学习社区的研究结果类似[38]。学术社区的知识收敛还处于潜在发展状态，用户之间更加注重问题的解决而不是观点的讨论，较难升华观点至更深层级，最终导致社区知识与集体智慧缺乏凝练；
②在学科差异上，工程技术和自然科学用户知识联结和收敛的比例更高，其中，量子化学表现出更明显的高阶思维与深层认知。一方面可能是因为小木虫以理工学科版块为主，另一方面可能是本研究选取的具体分支学科无机非金属、信息科学、量子化学都带有交叉学科的属性，交叉学科需要解决一些综合性问题，网络学术社区正好满足了这些研究人员对公共交流平台的需求，可以通过与其他用户的深度交互打破自身的思维壁垒，完善研究内容并促进研究成果创新。

（4）本研究深入探究了交互模式、会话长度与知识建构水平的关系。以往较少有研究将三者结合分析。本研究揭示了不同会话模式的知识建构水平差异，问题澄清模式知识建构水平显著低于回答协商模式和回答扩充模式。李月琳等[12]针对在线健康医疗平台用户与医生交互模式，认为初始问题描述不明确引发的螺旋式对话，比用户需求描述准确、医生解释详细的直线式效率低。本研究同样证实了问题需求表达影响和塑造了用户交互模式与交互质量。问题协商和回答扩充蕴含更复杂多样的直线式或螺旋式交互方式，更有可能达到较高的交互质量水平。回答协商模式通过更复杂的观点碰撞提升知识建构的深度，回答扩充型的会话模式能够带来更广泛的围观和参与，提升知识建构的广度。

围绕会话长度（或线程参与用户数量）的影响研究存在较多争议。Hew等[39]、Sin等[28]的研究发现，在线讨论论坛中参与用户数量同高质量的知识建构正相关；
Schellens等[40]则认为，越少的群体更可能达到知识建构的高级阶段，因为参与人数太多可能造成认知负担。本研究结果显示会话长度在不同会话情境中的作用具有差异性，在问题澄清和回答扩充模式中，会话长度对知识建构质量水平起着促进作用，而在问题协商模式中知识建构质量水平不受会话长度的影响，更细致揭示了学术社区用户会话模式与知识建构的关系。

网络学术社区是现实科研环境的延伸，探讨网络学术社区用户交互的会话结构，有助于了解学术用户会话交互规律，提高交互效率，提升不同学科会话交互知识建构的质量水平，为网络学术社区的持续发展提供有针对性的建议和参考。由于学术社区用户会话交互的动态性与复杂性，用户的会话交互过程较难细致刻画。本研究采用定性与定量相结合的方法为未来用户数字会话分析提供了新的方法和视角。基于学术社区用户会话真实语境，本研究融合定性内容编码分析、会话序列分析、统计分析等方法，对自动抓取的丰富数据展开深入挖掘和结构化分析，克服了以往依靠质性小样本数据及单一维度的研究局限。针对学术社区用户会话结构分析不足，聚焦用户会话交互行为的序列结构、交互模式，同时深入剖析了学术社区用户知识建构质量现状，丰富了网络学术社区用户会话交互行为研究体系。

（1）引导用户改进会话交互方式，提升会话交互质量。统计分析结果显示，1485个会话线程中存在1/4的空问题序列，问题澄清模式也是样本数量最多的会话模式，说明在网络学术社区中，用户如何正确提问和表达需求是需要提升的重要技能，社区系统应予以合理的引导和干预。或尝试设置付费回答专区等措施，提高用户回帖的积极性，同时鼓励有影响力的用户发挥引领作用，对用户提问做出及时反馈，引导用户展开更复杂多样的交互模式，推动用户分析质疑、深入思考、迁移应用等深层知识收敛建构，改善学术社区浅表化和碎片化交流的弊端，促进集体知识建构和集体智慧的形成。

（2）会话过程的建模挖掘以及会话模式的识别为智能问题系统设计提供了针对性指导意见，为提升用户体验提供了理论依据。本研究自动分析会话序列，识别3种主要会话模式，分别从会话启动、展开和中止或唤醒阶段揭示了用户不同的交互特征，为论坛改进交互设计提出要求。例如，为改进问题澄清式的低效率会话，可尝试在会话启动阶段以结构化方式引导用户提出咨询问题；
在会话展开后可采用机器学习技术对用户低质量的交互行为进行识别和干预。针对不同问题类型进行建模分类，本研究显示在提问时设置交流、讨论、调研（有奖）等分类有助于吸引更多用户参与；
会话线程中更多地引用问题，将对其他用户的回复直接显示在原回帖的下方，有助于提高会话的针对性，便于用户之间对某一回复内容的观点进行深入讨论，引导用户展开回答扩充或问题协商交互，充分挖掘用户交互潜力。

（3）高度重视交叉学科用户的交互服务。本研究显示，交叉学科用户表现出对学术社区的旺盛需求，量子化学用户的交互质量均呈现较高水平。交叉学科已经成为我国第14个学科门类，网络学术社区应抓住机遇和挑战，基于平台自身已有的信息网络和庞大用户群体，开辟专门的交叉学科分区，将不同学科的人才汇聚在一起，促进跨学科合作交流，产生新增长，并通过交叉学科用户对学术社区的依赖和黏性，逐步带动整个论坛的活跃度，提升交互质量，促进社区持续繁荣发展。

本研究存在一定局限性。在研究对象方面，只选择了一个中文网络学术社区，在后续研究中需选择国内外更多社区予以验证。在研究内容方面，采用人工编码结合统计分析，未来可利用机器学习方法展开会话交互模式的自动标注和识别抽取，进一步验证研究结论。在会话交互行为方面，由于较少研究将序列分析引入学术社区的会话行为，因此本研究是一次尝试，研究结果的代表性还有待进一步验证。不同交互模式的影响因素，特别是会话长度和会话模式的交互作用、空序列的挖掘分析等都是值得探讨的重要问题。

猜你喜欢会话建构学术学术是公器，不是公地社会科学(2021年5期)2021-10-27情境—建构—深化—反思课程教育研究(2021年15期)2021-04-13残酷青春中的自我建构和救赎新世纪智能(高一语文)(2020年9期)2021-01-04QQ和微信会话话轮及话轮转换特点浅析长江丛刊(2020年17期)2020-11-19如何理解“Curator”：一个由翻译引发的学术思考中国博物馆(2019年2期)2019-12-07建构基于校本的听评课新文化福建基础教育研究(2019年5期)2019-05-28对学术造假重拳出击商周刊(2019年2期)2019-02-20建构游戏玩不够幼儿教育·父母孩子版(2016年12期)2017-05-24基于集群节点间即时拷贝的会话同步技术研究①计算机系统应用(2017年3期)2017-03-27年龄大小的种种说法中学教学参考·语英版(2008年8期)2008-11-26

Tags：交互会话中文

上一篇：财经类纸媒智库化转型措施探析
下一篇：业财融合视角下加强企业全面预算管理的措施探讨