用机器学习探索工作场所指标的开云体育网上投注未来

2022年10月18日迈克·奥尼尔博士

以人为本的工作场所设计的优势已经改变了我们评估工作场所成功的方式。在以前的博客，我们概述了工作场所设计的变化、新的数据来源以及向预测分析的转变将如何改变我们在工作场所研究中使用数据的方式。我们建议设计成功的衡量标准应该包括劳动力和业务成果。大量新型数据正在扩大了解工作场所、建筑甚至社区特征与这些结果之间关系的机会。

在这篇博客中，我们讨论了新兴的数据平台和数据科学工具(如机器学习)，在理论和适当的研究设计的指导下，如何揭示如何创造有效工作场所的新见解。

新的数据科学工具和平台可以揭示新颖的见解

创建包含各种数据来源(如网站或在线公共数据库、建筑控制系统和传感器等)的统计模型的复杂性仍然是一个挑战，特别是使用传统的社会科学研究方法和分析。数据科学的分析工具，如机器学习(ML)，提供了一个补充和扩展现有社会科学方法能力的机会。我们将ML定义为使用灵活的算法和统计技术收集、处理、发现模式或解释数据的技术组件的集合。术语“深度学习”通常用于描述人工神经网络(ANN)模型。这些模型可以是预测模型，也可以是分类模型。例如，Netflix有一个“推荐”工具，使用预测模型，分析你的观看历史，建议你可能喜欢看的电影。大多数垃圾邮件过滤器使用分类模型来识别“垃圾邮件”或“非垃圾邮件”。

ML工具不仅可以处理惊人的大量数据，而且以前社会科学研究人员无法使用的数据形式现在也可以访问。这些数据可以包括图像、声音、语音、视频、自由文本、传感器数据、社交媒体帖子、包含详细人口信息的地理信息数据(GIS)、公共卫生数据库和其他可靠来源。ML应用程序往往需要(并使用)大量潜在的不同类型的数据。这使得“清理”和转换数据以供深度学习模型使用成为一项关键的(更不用说耗时的)任务。它还需要扎实的统计基础，以确保数据的底层分布，并且模型使用的原始数据的任何转换都是合适的。虽然任何统计分析都是如此，但输入数据的质量对于ML模型的功能是如此不可或缺，以至于如果没有它们，人工智能被描述为“数学的小说”。

一种新兴的模块化数据托管平台使无缝连接和分析不同的数据类型和大量数据成为可能，从而创建新的见解。这些平台允许访问传统的社会科学统计数据，但也提供ML工具。这些平台，再加上机器学习工具，可以从根本上改变我们理解工作场所设计、行为和社会现象以及业务成果之间关系的能力。例如，能够轻松访问大量的空气质量、噪音水平和照明数据，再加上空间利用和工作场所调查数据，可以对员工离职产生新的见解。

社会科学采用演绎法;数据科学通常是归纳的

数据科学和社会科学项目的目的有根本的区别。社会科学通常(但不是唯一)使用“演绎”方法，通过收集和分析数据来检验关于现有理论的假设。演绎推理是以理论为指导的;收集的数据是为了验证这一理论。目的是找出解释结果的因素。

数据科学项目通常使用归纳方法，没有指导理论或假设。从数据中观察到的数据被用来发展一种可以解释这些模式的理论。数据科学模型最常出现在商业应用程序中，其中模型的准确性非常重要(例如，准确预测消费者的选择)。解释选择背后的因素(即检验消费者选择行为的理论)并不是我们的意图。

静态模型与可适应模型

社会科学研究人员建立“手工制作”的模型，作为理论的证明声明。他们使用所有可用的数据来建立模型。这些模型的参数是静态的。它们使用历史数据构建，使用一次，几乎从未使用其他数据重新验证，然后发布。

相比之下，数据科学家使用数据集的一部分来训练、测试和验证他们的模型，并且这些模型的质量可以随时通过使用作为迭代发现过程一部分添加的新数据进行“训练”来提高。ML工具可以优化这些模型的内部参数，以提高模型的质量。

用机器学习探索工作场所研究的前沿

如前所述，虽然ML模型可以非常好地正确预测结果，但它们是一个“黑箱”，因为它们不是设计来识别或验证与结果相关的潜在因果因素。因此，社会科学家不太可能利用这些工具。然而，有新的机器学习方法基于博弈论的运用技术这可以告诉我们模型中的每个因素对预测的贡献有多大。这些技术可以帮助识别和可视化模型中的重要关系，解释其内部工作原理和基本原理——为其预测添加强有力的解释。这些技术并不等同于证明因素和结果之间的因果关系，也不能推广到更广泛的理论，但尽管如此，这些工具提高了这些模型的效用。

真正的潜力在于，具有数据科学背景的社会科学研究人员可以应用社会科学方法的严谨性来获取ML工具的强大功能，以处理新数据的宝库，这些新数据可能会使我们在理解工作场所如何影响人们方面取得突破。ML，加上基于既定行为理论的假设，使用现场或实验研究设计和数据收集，无疑将带来新的见解。与计算机科学和统计学中机器学习的传统任务不同，当机器学习应用于社会科学数据时，它可以用于识别重要的结果变量并进行预测。ML统计模型的一个强大的区别在于，它们可以随着时间的推移通过使用新数据进行训练来学习和改进，甚至可能会发生变化他们预测或分类的东西．

以前无法获得的大量数据来源的时代为工作场所研究人员提供了扩展他们工具箱的机会。机器学习方法非常适合帮助研究人员最大限度地利用丰富的数据。然而，机器学习工具只是工具，而不是免除研究者遵循研究最佳实践的魔杖(例如，适当的研究设计、假设，以及测试数据中的正态性、线性和方差相等的假设)。

在社会科学中，当ML被适当地应用于研究问题时，它将表现得最好。研究人员需要创造性地思考统计任务，并考虑机器学习应用程序是否有优势。也许最重要的考虑是，现在可用的数据数量惊人，使用分析工具相对容易，这使得理论——以及可能构成理论基础的具体模型——对于进行高质量的研究至关重要。理论和模型为如何设计研究、制定研究假设和问题、选择正确的分析工具以及如何解释结果提供了重要的路线图(Ashworth et al. 2015, Slough 2019, de Marchi & Stewart 2020)．

机器学习工具的下一步

职场研究正在进入一个“财富尴尬”的时代，机器学习工具提供了一个从以前无法使用的数据类型中提取意义的机会。在工作场所研究中加入ML并非万灵药;它比以往任何时候都更需要我们仔细地应用正确的工具来满足特定的分析需求，并开发最佳实践。当机器学习应用于工作场所研究时，它可以用来发现新概念，揭示数据中的模式和关联，并进行预测。ML将为社会科学的演绎“单时间点”方法增加一个新的维度，以一种更具互动性和迭代性的研究方法。最后，机器学习的归纳和定性结果(例如揭示相关数据模式)可能提供有用的视角，有助于解释工作场所设计和用户体验的定性性质。

由Gensler研究所(GRI)领导的跨职能团队正在使用数据科学工具和城开云体育全站登录平台入口市、社区、建筑、室内设计、人口统计和调查数据的新来源来调查这种方法的长期潜力。其他GRI资助的内部项目也在使用ML来利用我们现有的数据集来揭示关于用户体验的见解。

如有媒体查询，请发送电子邮件．

所有的帖子

迈克尔•奥尼尔
Mike博士领导Gensler研究所的数据科学研究。开云体育全站登录平台入口他长期的研究领域是理解工作场所设计与员工压力、幸福感和绩效之间的交集。他在商业办公家具行业有数十年的研究领导经验，为财富1000强客户提供咨询，并领导内容开发。迈克住在德克萨斯州的奥斯汀。与他联络:Mike_O 'Neill开云体育全站登录平台入口@gensler.com．