作者都是各自领域经过审查的专家,并撰写他们有经验的主题. 我们所有的内容都经过同行评审,并由同一领域的Toptal专家验证.
拉维尼乌斯·马库的头像

Lavinius Marcu

作为一个专门研究数据科学的产品经理, Lavinius帮助客户提高产品性能并扩大业务规模. 他的投资组合包括创建一个人工智能价格预测引擎, 哪家公司使用机器学习来预测邮轮行业的最优定价.

以前在

Travelport
分享

在你职业生涯的某个时刻 产品经理, 您可能会面临不太明确的大规模问题, 涉及更广泛的原因和影响领域, 并且有不止一个解. 当你发现自己和 复杂数据集当你开始考虑以百万计而不是以千计的数字时,你需要正确的工具使你能够以同样的速度扩大规模.

这就是数据驱动的产品管理可以产生巨大商业价值的地方. 下面的例子来自我自己的职业生涯, 应用数据分析 这些看似棘手的问题都产生了解决方案,为我的雇主带来了巨大的回报——从数百万美元到数亿美元不等.

收购 数据科学 技能可以帮助你在产品管理职业生涯中打造下一条成长之路. 你会比你的同事更快地解决问题, 将基于证据的见解转化为实实在在的回报, 并为组织的成功做出巨大贡献.

利用大规模数据

将数据科学应用于产品管理和 产品分析 是不是一个新概念. 什么是新的是惊人的 数据量 供产品经理访问, 无论是通过他们的业务平台, 数据采集软件, 或者产品本身. 而在2020年,希捷科技 报道 公司收集的68%的数据没有被利用. 2014年IBM白皮书 相比 这些数据被浪费到“大量原材料未被使用的工厂,并散落在装配线的各个地方”.”

具有数据科学技能的产品经理可以利用这些数据来获得见解 关键指标 比如激活、覆盖范围、留存率、粘性和盈利. 这些指标可以调整为a 产品类型范围,就像 电子商务、内容、 api, SaaS 产品, 移动应用程序.

简而言之, 数据产品管理不是关于收集什么数据,而是关于如何以及何时使用数据, 特别是当你处理新的高阶数的时候.

挖掘数据,找出根本原因

几年前, 我在一家旅游技术供应商工作,有50多名员工,在180个国家拥有5000名活跃客户, 3,700名员工, 和2美元.年收入50亿美元. 在这种规模的公司里,你管理着庞大的团队和大量的信息.

当我开始在那里工作的时候, 我遇到了以下问题:尽管有最新的路线图和完整的待办事项, NPS分数下降,客户流失率在两年内上升. The costs associated with customer support grew significantly and the support departments were constantly firefighting; during those two years, 支持电话翻了两番.

在我的头三个月, 我研究了企业是如何运作的, 从供应谈判到投诉解决. 我采访了产品副总裁和她的团队, 与销售和技术团队的副总裁联系, 并与客户支持部门进行了广泛的交流. 这些努力产生了有用的见解,并使我的团队提出了几个假设,但没有提供确凿的数据来支持这些假设,也没有提供拒绝这些假设的依据. 客户不满意的可能解释包括缺乏功能,就像 the ability to edit orders after they were placed; a need for add-on products; and insufficient technical assistance and/or product information. 但即使我们能决定单一的行动方案, 说服各部门同意这一计划需要一些比可能性更坚定的东西.

在一家较小的公司,我可能会从进行客户访谈开始. 但它拥有数十万的终端用户群, 这种方法既没有帮助,也不可行. 虽然它会给我提供大量的意见——其中一些是有效的——但我需要知道,我所处理的信息代表了一个更大的趋势. 而不是, 在商业智能团队的支持下, 我从呼叫中心和客户支持部门调出了所有可用数据.

过去六个月的支持案例以四列形式出现在我面前,每列有13万行. 每行表示一个客户支持请求, 随着客户在护理过程中的进展,每一列都标有客户的问题区域. 每个列有11到471个不同的标签.

标题为“客户支持数据”的插图.这幅插图代表130,记录数据的000行, 有四列问题区域, 确定为第一个问题区域, 第二个问题领域, 第三个问题领域, 第四个问题领域. 每列中问题区域标签的数量记为11个标签, 58标签, 344的标签, 和471标签, 分别.
客户支持数据,包括130,000个单独的案例,每个案例有四个问题领域.

使用过滤器和对大量数据集进行排序并没有产生结论性的结果. 个别问题的标签不足以捕捉更大的图景. 客户可能会首先打电话来重置密码, 虽然这通电话会被记录在案, 在将所有四个问题视为一个字符串之后,一个不同的根本问题可能会变得明显. In 130,000行,包含数百万个可能的字符串, 通过单独检查每一行来寻找模式不是一种选择. 很明显,在这种规模上识别问题与提供业务洞察力无关,而更像是解决一个数学问题.

为了隔离最频繁出现的字符串,我使用 概率与大小成比例(PPS)抽样. 此方法将每个元素的选择概率设置为与其大小度量成正比. 虽然数学很复杂, 实际上, 我们所做的很简单:我们根据每列中每个标签的频率对案例进行采样. 一种形式 多级抽样, 这种方法使我们能够识别出一系列问题,这些问题更生动地描述了客户为什么要打电话给支持中心. 第一个, 我们的模型从第一列中识别出最常见的标签, 然后, 在这个群体中, 第二列中最常见的标签, 等等......。.

标题为“PPS抽样后的客户支持数据”的插图.这幅插图代表130,记录数据的000行, 有四列问题区域, 确定为第一个问题区域, 第二个问题领域, 第三个问题领域, 第四个问题领域. 每列中问题区域标签的数量记为11个标签, 58标签, 344的标签, 和471标签, 分别. 另外, 添加高亮显示的框来表示每个问题区域中常见标签的标识.
应用PPS采样后的客户支持中心数据, 使用标识最频繁出现的标签字符串.

应用PPS抽样后, 我们分离出2%的根本原因, 占总病例的25%左右. 这允许我们应用累积概率算法, 它揭示了超过50%的病例源于10%的根本原因.

这个结论证实了我们的一个假设:客户联系呼叫中心是因为他们在下订单后没有办法更改订单数据. 通过解决一个问题, 客户可以节省700万美元的支持成本,并收回因客户流失而产生的2亿美元收入.

执行实时分析

机器学习的知识在解决另一家类似规模的旅游公司的数据分析挑战时特别有用. 该公司通过网站和api充当世界各地酒店和旅行社之间的联络人. 由于元搜索引擎的激增, 比如特里瓦戈, Kayak, 和Skyscanner, API流量增长了三个数量级. 在元搜索泛滥之前, the look-to-book ratio (total API searches to total API bookings) was 30:1; after the metasearches began, 一些客户的比例会达到30,000:1. 繁忙时间, 这家公司不得不容纳多达15人,每秒000个API请求而不牺牲处理速度. 与API相关的服务器成本也随之增长. But the increased traffic from these services did not result in a rise in sales; revenues remained constant, 给公司造成了巨大的经济损失.

公司需要一个计划来减少由于流量激增而造成的服务器成本, 同时保持客户体验. 当该公司过去试图阻止特定客户的流量时, 结果是负PR. 因此,封锁这些引擎不是一种选择. 我的团队转向数据来寻找解决方案.

我们通过一系列参数(请求时间)分析了大约3亿个API请求, 目的地, 签入/出日期, 酒店列表, 客人人数, 房间类型. 从数据来看, 我们确定某些模式与元搜索流量激增有关:一天中的时间, 每个时间单位的请求数, 按字母顺序搜索目的地, 酒店订货单, 特定搜索窗口(入住/退房日期), 和来宾配置.

我们应用了 监督式机器学习 方法并创建了一个类似的算法 逻辑回归:它根据客户端发送的标签计算每个请求的概率, 包括delta时间戳, 时间戳, 目的地, 酒店(s), 签入/出日期, 客人人数, 以及之前请求的标签. 取决于给定的参数, 该算法将确定API服务器请求是由人工生成还是由元搜索引擎生成的概率. 这个算法会 作为访问API的客户端实时运行. 如果它确定请求是人为驱动的可能性足够高, 请求将被发送到高速服务器. 如果是元搜索的话, 请求将被转移到操作成本较低的缓存服务器. 监督学习的使用使我们能够教授模型, 从而在开发过程中获得更高的准确性.

该模型提供了灵活性,因为可以根据比我们以前使用的更具体的业务规则对每个客户端的概率进行调整.g.、每日预期预订量或客户级别). 对于一个特定的客户, 请求可以定向到概率超过50%的任何点, 而更有价值的客户, 我们可以要求更多的确定性, 当他们超过70%的概率阈值时,就会引导他们.

标题为“通过机器学习算法对客户端进行排序”的插图.这张图是一个流程图,显示了根据请求的来源对请求进行排序的可能路径. 流程图的开头有两个可能的起源,“互联网用户”和“元搜索”.两者都指向“XML, API Server”.这就引出了“自然搜索”?如果结果为“是”,则下一步是“高速服务器”.如果结果为“否”,则下一步是“缓存服务器”.之后,两者都被引导回“XML, API服务器”.”
将请求排序到高速服务器或缓存服务器的路径, 取决于它们的原点.

实现后的分类算法, 在给定的时间框架内,该公司将高达70%的请求转移到更便宜的堆栈上,预计每年可节省500万至700万美元的基础设施成本. 与此同时,该公司通过不拒绝流量来满足客户群. 它在保持收入的同时保持了预订率.

为工作使用正确的工具

这些案例研究展示了产品经理使用数据分析来解决复杂产品问题的价值. 但是你的数据科学之旅应该从哪里开始呢? 很有可能,您已经对广泛的知识领域有了基本的了解. Data science is an interdisciplinary activity; it encompasses deeply technical and conceptual thinking. 这是大数字和大创意的结合. 要开始,你需要提高你的技能:

编程. 结构化查询语言(SQL)是管理数据库的标准编程语言. Python是统计分析的标准语言. 而两者有重叠的功能, 在一个非常基本的意义上, SQL用于检索和格式化数据, 而Python则用于运行分析以找出数据可以告诉您的内容. Excel虽然没有SQL和Python那么强大,但可以帮助您实现 许多相同的目标; you will likely be called on to use it often.

运筹学. 一旦你有了结果,然后呢? 如果你不知道如何使用,世界上所有的信息都是毫无用处的. 运筹学 是否有一个数学领域致力于将分析方法应用于商业战略. 了解如何使用运筹学将帮助您做出有数据支持的合理商业决策.

机器学习.人工智能正在崛起机器学习的进步为预测分析创造了新的可能性. 预测分析的商业应用从 23% in 2018 to 59% in 2020市场也是如此 期望经历 24.到2026年,复合年增长率为5%. 现在是时候让产品经理 了解什么是可能的 随着技术的发展.

数据可视化. It’s not enough to understand your analyses; you need tools like Tableau, Microsoft 权力BI,和Qlik Sense to 传达结果 以非技术涉众容易理解的格式.

最好是自己掌握这些技能, 但至少你应该熟悉聘请专家和委派任务. 一个好的产品经理应该知道可能的分析类型以及他们可以帮助回答的问题. 他们应该了解如何与数据科学家沟通问题以及如何执行分析, 并且能够将结果转化为业务解决方案.

运用权力推动回报

NewVantage Partners的2022年预测 数据和人工智能领导高管调查 超过90%的参与组织正在投资人工智能和数据计划. 从大数据和商业分析中产生的收入 超过两倍 自2015年以来. 数据分析, 曾经是一项专业技能, 现在对于为各地的公司提供正确答案至关重要吗.

聘请产品经理来提高回报, 确定战略, 从同事那里激发出最好的工作. 真实性、同理心和其他 软技能 在这方面是有用的,但它们只是等式的一半. 数据驱动的产品开发将帮助您成为组织内的领导者, 把事实摆到桌面上, 没有意见. 开发基于证据的见解的工具从未像现在这样强大, 潜在的回报也从未如此之大.

了解基本知识

  • 简单来说,什么是数据科学?

    数据科学是一套跨学科的工具和技术,致力于在大量数据中发现模式.

  • 产品经理如何使用数据科学?

    数据科学的技术和方法, 以及产品经理从数据中提取的信息, 可以用来产生商业见解吗. 独立工作或与组织中的数据科学家一起工作, 产品经理可以使用数据科学来做出基于证据的业务决策.

  • 数据科学对产品经理有用吗?

    本文中的案例研究说明了这一点, 将数据科学应用于产品管理可以为组织节省数百万美元. 掌握数据科学的产品经理将更有效地识别问题, 更快地解决问题, 让自己成为公司的宝贵资产.

就这一主题咨询作者或专家.
预约电话
拉维尼乌斯·马库的头像
Lavinius Marcu

位于 英国伦敦

成员自 2021年1月14日

作者简介

作为一个专门研究数据科学的产品经理, Lavinius帮助客户提高产品性能并扩大业务规模. 他的投资组合包括创建一个人工智能价格预测引擎, 哪家公司使用机器学习来预测邮轮行业的最优定价.

Toptal作者都是各自领域经过审查的专家,并撰写他们有经验的主题. 我们所有的内容都经过同行评审,并由同一领域的Toptal专家验证.

以前在

Travelport

世界级的文章,每周发一次.

订阅意味着同意我们的 隐私政策

世界级的文章,每周发一次.

订阅意味着同意我们的 隐私政策

欧博体育app下载

加入总冠军® 社区.