楼主Stat PhD, BioStat post-doc。由于政府funding缩减 开始转向业界招工\n5轮Google DS L4 面试 一轮平均1小时 分享一下面筋 每次面试前面试官都会自我介绍并且会去了解你的research\n\n1)case study: given 一个手机现有的电量 predict手机还能使用多久,需要编程实现线性插值 还有一些data intuition 比如在predict手机还能使用多久时候 需要考虑引入什么变量。 如果没有类似手机的历史数据 如何predict (楼主想的是可以基于手机特质进行一些feature matching去predict).google и\n2)基本统计概念:duplicate the data for linear regression, what will happen for the coef? (比如its estimate and standard error)。解释p-value的实际意义。Chi-square test 和对sample size 大小的考虑 (比如加入惩罚项去调整结果的可参考性)\n3)模型:给出一个真实的model fit例子 需要指出在其出现的问题 比如把月份当成continuous去fit model,fit model前没有去standardize数据,sample是imbalanced 需要去调整loss function和最后model evaluation的准则 (比如需要考虑recall metric之类的)\n4)编程:主要涉及的都是R 的dplyr的应用 包括sample proportion of the data frame (slice_sample()),left join two data frames,还有一些simulation study。比如given one data frame, randomly select half of them being the same price, the rest being increased 10% in price, compute the average of price for each simulated data. 1point 3acres\n5)Behavior问题:focus 在简历和research 还有如何与multi functional team 合作