找工作一段时间了, 还是没有offer, 攒攒人品,把之前面试的公司问题分享一下\n\nThumbtack data scientist\n.google и\n1) 第一轮是在线的modeling, 主要考察你对数据的处理和分析能力.\n 给出的CSV文件,是关于用户提交一个任务后, thumbtack 记录有多少provider给了 response. 然后里面有任务(job)的一些信息,用户的信息和provider信息。\n A. 给出那种job 会得到最高的response rate (hiht: 使用python group by function , 然后除以每个job 的总共的邀请人数)\n\n B. 给出是不是不同地区会有不同的response rate, 然后问了你,为什么,给出你能想到的答案\n C. 给出不同时间的response rate 是怎么变化的,为什么,你可以建模去预测response rate 吗?\n.--\n2)直接就是On-site,\n A. 第一轮是presentation, 讲一下你的一个project, 要和data scientist 相关\n B. 第二轮是编程,都是实际工作中会遇到的,我的题目是编程实现 TF-IDF\n C. 第三轮和manger谈,主要是看你对一些问题的想法,没有编程,比如说你怎么知道新的模型是成功的,(AB test)\n D. 午饭是和一个engineer 谈,然后因为英文不好,又很吵,感觉很不好。\n E. modeling, 给你一个数据,和一个target, 让你想办法建模。一定要对data scientist pipeline 比较熟悉-> 预处理,missing value, 对feature 编码等,然后就可以建模型,最好两个,这样可以比较。(我就是卡在这里,.....)\n\n虽然过去一个多月了,但这是第一个onsite. 希望对大家有点帮助。\n希望自己和大家offer 多多!