Once you’re a trained data scientist, what will your new careerreallybe like?Trace the experiences a data scientist might encounter on a typical day, including mining for good data, cross-functional meetings, lots of back-and-forth with internal clients—and, of course, some tough math.
7:45 a.m. – Quiet Time
你到达你的Breakthrough Beverages在手机开始响起之前,办公室很早就有一些安静的思维时间,您的收件箱充满了标有紧急的消息。Breakthroughis a rapidly growing sports beverage company that markets its products as “naturally healthy” vs. its competitors, who it derides for their reliance on “artificial chemicals.”
您目前的重中之重是预测通过销售来衡量的上诉,是针对千禧一代的替代饮料系列中的三个不同产品功能的:玻璃瓶而不是塑料,一种无防腐剂饮料以及没有人造甜味剂的低热量配方。您一眼瞥见同事在上一份工作中的水晶球,这使您成为了礼物。有时,您希望自己有一个真正的。
您的第一个挑战将是获取正确的数据,这将包括来自其他发布会和销售团队预测的销售记录的更多。Facebook,Google和Twitter是显而易见的social mediaoptions, but you’re leaning toward Instagram for its younger demographics. Looking at mentions and likes should be enough. You make a note to take a close look at these four channels, and to add a line item in the final project budget to cover the cost of external social media data.
上午9:32 - 扑灭大火
Your smartphone announces a priority call. It’s Phil Brooks from marketing, asking for an update on someA/B测试对于与“新兴体育”相关的网络营销促销活动 - Skateboarding活动,跑酷课程,甚至是曲棍网兜球比赛。您已经将项目交给了桑迪·斯皮斯(Sandy Speith),后者是一位刚刚雇用的初级数据科学家,他还没有。您保证将在中午之前给布鲁克斯打电话,然后向您的队友发送紧急电子邮件,要求进度报告。
上午9:55 - 当天的大型会议
您走到主要会议室,后来被称为“ Quench”突破的签名饮料,用于关于一个有关一个主要新项目的输入会议优化分布。Breakthrough Beverages越来越大,以至于诸如仓库诸如储备仓库之类的替补策略,以确保零售商能够获得足够的产品的成本过高。该团队希望数据科学团队能够帮助他们修改分销网络,以使产品更快地将产品传给零售商。
房间里到处都是重型企业,包括两个创始人。您从与所需的变量有关的一些非常简单的想法开始,例如制造,物流和销售的数据,直到邮政编码级别。它很可能还涉及流式GPS数据。使用生产,仓库和邮政编码级别的消费者收购数据,正确的预测分析算法可以减少管道中过量库存的数量,从而削减成本。您对清洁数据的需求提供标准说明,并强调清洁数据不是免费的,尽管AI工具使其比以前便宜得多。
来回开始时,您会非常仔细地聆听。您的工作中最大的部分之一就是弄清楚您的内部客户真正需要什么,而不是他们的要求。今天,您可以看到问题在于在货架上拥有最新鲜的产品与库存管理一样,尽管这两个目标并不矛盾。从数据角度来看,您需要时间戳记的输入,以了解可能发生任何延迟的地方。您会为您在大学上学的那些一般商务课程感到感谢。数据科学不仅仅是数学。
您以非正式的下一步概述结束会议,其中包括初步查看可用数据是否对该项目有用,一对一会议,以更好地了解当前的日常程序和您可以完成所有工作的时间表。
上午11:15 - 咖啡和旅途中的决定
您在咖啡吧停下来进行快速浓缩咖啡,然后返回办公室与桑迪·斯皮斯(Sandy Speith)坐下来讨论体育促销活动。她想尝试一个multi-bandit方法而不是标准A/B测试。她有一个强烈的理由是,这种新方法将使更少的用户获得次优体验。你给她批准。现在,是时候在办公楼旁边的公园里跑步了。
下午12:30- 通过收件箱巡航
回到您的办公室,您吃了自助餐厅的三明治,并伴随着一瓶(塑料)Mango Madness,该公司最热门的饮料之一。虽然哟u’re eating, you go through your inbox and respond to half a dozen inquiries about the progress of various projects. Then, it’s time for your one o’clock meeting with Dave Chen, who is an excellent数据牧马人。
下午1点- 处理可疑数据
This meeting brings you back to the top priority of the day: the appeal of the three different product features. Within a few minutes, you confirm that the company sales data is not in good shape. You’re going to have to combine data from a number of systems and sources to create a data set you can use for prediction. That’s how data science works. You have to be part wrangler, like it or not. You spend the rest of the afternoon working with the sales data, and with the inevitable interruptions to deal with from people inside and outside of your team.
下午5:10- 保持电流
You set aside your query for the sales data to check out your favorite data science blogs for new developments and tips. You also stop by Quora. Once upon a time, you posted questions there about a career in data science. Now you answer them.
5:45 p.m. – Time for a Beer
经过漫长的思考,您的大脑很累。您前往布法罗,这是一个运动酒吧,啤酒占据着任何东西Breakthrough可能会卖。您大学的几个朋友会在那里,您可能会谈论运动,但是无论大脑是否疲倦,您都可能会争论算法。
Check out the数据科学学院阅读有关工作数据科学的更多故事。