第一轮:HR reach out , schedule 45-min 技术面\n1)概率题:draw three cards from a deck of cards (52). Given the first two at least one Ace, what the probability the third one is Ace?\n2) 代码题:Given a price array, the maximum profit。 具体解题思路可参考 5 Best Ways to Program to Find Maximum Profit with K Buy and Sell Transactions in Python。主要考的是dynamic program bottom up的想法\n\n第二天直接follow up, schedule 第二三轮连着一起两小时 (太累了)\n1)数学题: Given three random variable X, Y, Z and their pairwise correlations are both rho, what is the lower bound for rho? 主要从matrix的positive definite出发\n2)概率统计:Given R^2 and the coef of Y regressed on X, what is the coef of X regressed on Y (记得公式就很简单).google и\n3) 概率统计: Given X, Y follows uniform distribution, compute the covariance of max(X, Y) and min(X, Y)。 套Cov的公式就可以\n4)编程题:python left join 两个 data frames 但不许用任何package。需要提出一些efficient的方法(楼主不会 哭了)\n5)编程题:涉及手写python的 lazy evaluation,然后手写一个python的generator (需要用yield).1point3acres\n隔了几天 又schedule 四五轮 连着两小时 (一定要休息好 不然面着面着就困了)这次主要focus在模型 问了一些linear regression中的outlier 和 influential points (Cook's distance 和 high leverage points) 然后一些random forest的优化问题 比如prune tree 和 variable importance是如何计算的。一个case study 如何predict一个城市的房价,哪些factor需要考虑进model (楼主大概说了一些 地理位置 工资水平 还有一些其他的因素 比如地铁站 社区文化).1point3acres\n第五轮一开始比较behavior 问了博士期间上的课 和 research 然后突然开始考数学 手推函数的逆 和 逆函数的distribution。然后还考虑linear regression时候X维度过大的问题,可以分批导入数据计算beta.