分享下楼主2个月内全职在家找到DS工作的一些经验总结,工作日的时候平均每天花7个小时在准备,周末带娃没怎么复习了。希望能让大家少走弯路,节省时间,有个清晰的准备方向和提供些有用的资料。介绍下背景:2年多的DS工作经验,主要做的analytics, 现在正在FLAG中的某家team match,攒人品求一切顺利,求H1B名额能顺利转走并激活。找工作期间受到很多素不相识的同胞的帮助,希望大家团结起来,互相帮助。匿名发帖啦,怕被人认出来。BTW,我没设置过什么积分要大于88才能阅读的权限,我把这帖子内容放附件里了,隐藏的内容应该大家都看得到啦。\n\n\n\n这次找工作主要准备了下面5个方向:\n\nproduct sense\nSQL/python\nstats & probability\nAB test & hypo testing\nmachine learning\n\n第一轮复习:\nProduct sense:\n这部分需要很清楚各大公司的goal和盈利模式,他们看重的一些KPI,比如FB/Google主要靠广告收入,credit karma靠成功推荐信用卡,游戏公司根据是平台还是自主开发游戏关注的点又不一样了。熟悉各种metrics,对于一些问题能根据business goal提出最能衡量它的指标。\n这类问题的套路一般就是问各种clarification question,不要自己assume(也有例外的公司,我有个onsite就问了面试官各种问题,被面试官说你要会自己assume呀,我们工作中不可能有人给你各种建议提示),然后明白business goal -> metrics -> hypothesis, like it will improve blah blah -> collecting data -> analysis data -> conclusion/suggestion\n\n书:cracking the pm interview\n书:A Collection of Data Science Take-Home Challenges 里的 product questions部分\n一亩三分地的数据科学Analytics面试精选24题\n\nSQL/Python:\n主要复习了SQL一些语法和常用的window function,然后在leetcode做了几道题,\nPython主要就是复习了pandas这个包,把一些常用的函数自己琢磨了遍。自己写了个文件,涵盖了我面试过程中遇到的所有问题了。都无偿分享给大家,攒人品中。\n还刷了Leetcode easy 和medium的算法题,主要是array, string部分。这个帖子也很有帮助。\n\n🔗 medium.com\n\nStats & probability\n主要是把以前上的课拿出来复习了下,这部分主要考贝叶斯和全概率公式,有些公司会考正态分布二项分布,举个例子:比如投硬币,硬币次数投多了就根据大数定理正态分布啦,然后会问你下投的次数越多正态分布曲线怎么变化?还有投骰子。不会直接问你些概念性的东西,但是基本功要牢,问的时候能明白面试官想要考你什么。推荐个可汗学院的统计课,自己觉得挺不错的。还有个做题网站。\nhttp://open.163.com/special/Khan/khstatistics.html\nhttps://brilliant.org/\n\nAB test & hypo testing\n主要看了udacity这个,但是只能说这个是入门级的AB test,很基础但是也很重要,一定要看明白,不明白重复看直到明白了,然后就可以进入第二重境界啦,看高深的AB test。onsite面试过程中AB test环节会问的很深入,基本不会出现udaciy那么简单的问题。\nAB test 一般的套路就是 understand business goal -> define metrics -> hypo -> design test plans, sample size? Duration? Regions for AB testing? -> launch experiment -> sanity check and analyze result -> conclusion/suggestion\nhttps://classroom.udacity.com/courses/ud257\nNotes:http://rpubs.com/superseer/ab_testing\n添加几个我平时看AB test的网站:\nhttps://towardsdatascience.com\n🔗 medium.com\nhttps://www.optimizely.com. 1point 3acres\n这个帖子不错~ ..\nhttps://towardsdatascience.com/a-summary-of-udacity-a-b-testing-course-9ecc32dedbb1\n.1point3acres\nmachine learning\n我平时不做模型,所以花了大部分时间在准备这块内容上。建议从linear regression开始准备,基本功一定要打牢,linear regression是最简单的machine learning模型,把这个看懂了后面的其他模型或者一些术语就会融会贯通。面试过程中会问些LR的assumption,logistic regression的loss function,maximum likelyhood function,overfiting怎么办,不会直接问你regularization,但是会隐藏在其他问题里。\n\n强烈推荐这个课,老师讲的非常的清楚非常的好。\nhttps://www.coursera.org/learn/ml-regression/home/welcome.1point3acres\n上完后可以上Andrew Ng的machine learning,推荐cousera的这个,YouTube那个不大推荐,太花时间。建议认真看完这两个。. check 1point3acres for more.\nhttps://www.coursera.org/learn/machine-learning/home/welcome\n. Χ\n第二轮复习:.--\nproduct sense:主要就是看地里的面经和一些博客。还有自己开大开下脑洞。。。\n\nAB test & hypo testing:也是看博客了,你会发现AB test真的是水很深,比如control和test的samples size是90% 和10% 分布,同时测10个metric而不是一个,又要改什么?AB 测试需要注意的事项和assumption是什么? novelty effect是隐藏在这部分很重要的考点,怎么消除?违反了什么assumption?等等\n\nmachine learning. 1point3acres.com\n主要就是看面经了。自己也总结了