数据科学家应该具备的4种工作素质行业资讯
现如今,企业对于正当流行的大数据是难以抗拒的。而适当地利用大数据,企业可以让自己的业务更符合客户的需求,从而帮助企业增加利润,更有效地进行目标市场的产品投放。但由于缺乏合格的人才,尽管企业已经从市场收集了海量数据,也已然被忽略了,更不用说对这些数据信息进行分析以获取价值了。
数据科学专家可谓是现如今市场上最热门的职位之一了。而最合适的人选无疑是那些能够像熟练的钢琴家一样熟练操控统计计算语言的数字天才和学者们了。但现实中,我们很难将这种理想化的标准付诸于企业数据科学专家岗位的工作描述和筛选标准。
而在这篇文章中,我们将为大家介绍一些适合企业数据科学专家岗位的工作素质标准,d以帮助你团队的找出适合的数据科学家。同时,文章中还提到,当涉及到建立数据科学家的薪酬制度时的一些市场动态。
因为“数据科学家”代表了一个新的概念,而且并没有成熟的工作说明,企业的业务部门需要与人力资源管理部门密切合作,筛选初始简历,确定第一轮面试的标题和资格。下面五大要点,在您企业筛选数据科学专家候选资格时应该有所帮助。
1、一个好的数据科学专家应该理解统计和大数定律
数据中能够反映出趋势。举例来说,一个好的数据科学家能够从数据中了解到,“许多客户的行为反映了某种特定方式”或“某些客户的行为会与其他客户相交于许多精确的点。”大量的数据信息能够反映出数字趋势。
一个好的数据科学家不仅有能力理解大数据,同时还能对其进行翻译,预测分析市场的发展趋势。好的数据科学专家可以查询大量的数据并分析趋势,然后使用预测建模技术预测聚合数据集的行为。统计数据也有助于编写管理行为规定报告。
拥有数学学位的自然是理想的候选人,许多合格的候选人都曾接受过实用的专业学术学习。但企业也不必担心候选人缺乏先进的数学学科背景。对于拥有以统计学学术生涯为重点的候选人,无论其是本科或以上学历,都将被证明是足以胜任该职位的。
2、一个好的数据科学家应该具备对数据的好奇心
大数据的魅力和神秘感部分是源于(典型的)非结构化数据的巨大的可操作的结论。其通常还不够了解如何编写查询以查找特定信息,因而不能对其所运行的背景产生什么疑问、我们想了解和掌握什么样的数据、,以及哪些数据是我们应该了解和掌握,但尚未了解的,等等。
的确,好的大数据科学专家能够执行查询和数据库的运行,但他们还必须就相关的设计提出建议,使得相关的数据库查询不仅能够返回一组已经定义的结果,来回答已经有人问过得问题,同时更需要能够揭示还没有查询架构设计过的新的见解问题。而这是在未来几年一个数据科学家的真正价值所在。
虽然有些人可能认为这属于软技能,很难通过面试充分了解到。但企业可以通过精心打造面试时的假想情境帮助招聘者了解面试候选人的思维,了解他们将通过试图搜集各种方式来解决某个问题,以及候选人的问题可能会对原始查询带来的价值增加。面试期间应鼓励开放思维,以避免面试人选因面试题被限制了所谓的标准答案而气馁。
3、一个好的数据科学专家需要熟悉数据库的设计与部署
今天,一个好的大数据科学家能够担任大学里的大数据研究领域的研究科学家(其研究角度上文已经阐述)与企业软件开发人员或工程师之间沟通的桥梁是相当重要的:企业需要有人知道如何调整实验室及操作相关的机械设备。
尽管多数被归类于“大数据”分类的其实都是非结构化数据,但对于结构化和非结构化数据的关系和柱状数据库熟悉是一个好的数据科学专家的基本工资素质。许多公司的数据仓库都是传统的基于行的数据库排序。而大数据是新的、可操作的数据,其趋势必然有别于传统的数据库。
数据科学专家注充分利用新技术的优势建立分析和生产数据库方面,也将发挥关键作用。拥有使用数据库的历史背景将有助于建立新的系统。
此外,许多大数据软件开发人员尝试在其产品上使用类似于SQL的语言,企图讨好不想学习类似于MapReduce这样的语言的传统数据库管理员。传统SQL的知识将继续发挥作用,使数据科学家能够很好地发挥作用,并与其他数据库专业人士有效合作。
4、一个好的大数据科学家要精通脚本语言
最合格的候选人了解Python会获得额外加分。在大量非结构化数据的查询工作采用的是脚本语言,需要相当长时间来运行发布。
Python是公认最兼容的,与纵列数据库(columnar database)兼容最通用的脚本语言,MapReduce风格的查询和其他数据科学家困惑的元素。Python是一个开放源代码语言可谓相当有用,易于读取,所以应该不会对基础数据科学家构成太大障碍。
也可以考虑“伪代码”的技能,或考察候选人是否能够以简单的语言来描述算法和查询工作。这样的试验会显示面试候选人的思维质量和解决一个问题的方法,无论他或她是否真的具有任何给定语言的技能。
准备好与数据科学专家进行薪酬谈判
随着企业对于数据科学家需求的增加,只要合格的候选人的确足够优秀,工资肯定都会上涨。在包括美国的几乎所有市场,数据科学家的基本工资都是六位数字——而在美国西海岸,如硅谷明显会高于市场成本高价。在,尤其是足够优秀的人选并不多见。
不要试图以低于市场的薪酬价格来支付这一职位的员工。即使是初创型企业也有必要为数据科学家们付出合适的工资,让他们工作的创造出具有挑战性的新产品。简单地说:对于优秀人才,不要舍不得钱。