[转载 From MITBBS] 报几个offer(update 面筋)

Master + 3year 湾区超级屌丝三线非互联网公司,最近面了6家,按面的顺序一个一个
来报

Cloudera(offer):

phone: max points on a line
       binary tree inorder/preorder recursive/iterative

onsite:
       1.三哥implement ReadWriteLock
         implement stack using array
         java generic/template
       2.三哥get average on sliding window
         how to do it thread safe without lock
       3.lunch...
         given a matrix has 0 in it, find an area that has largest sum
         有点像leetcode那道小岛题
       4.三哥hiring manager talk 
         project presentation
       5.白人lead explain TCP/UDP protocol, how it works
         design RPC API
         how to do callback in java
       6.白人lead suppose a communication protocol breaks on "X" letter, how
do you encode a string.

这家是第一家面的,也是面的最烂的,考的基础知识太多,真心不记得,没想到给过了
,而且hire manager跟我说feedback是strong hire。。。lunch那轮阿三送我回
meeting room的时候突然说要考一个coding,尼玛只剩下10分钟,还好写出来了,不知
道他是不是想恶心我。hiring manager 人超级nice,可能是他力挺的吧,真没想到能
拿offer。有了第一个offer后面面起来会轻松不少。

offer: 155k + 10% + 200k value of stock over 4 years = 220k 
每年有refresh,stock是70%RSU+30%option,四月融了一大笔钱,估值4B,他们说年底
上市。阿三偏多,也看到国人了,每天中午包午餐,福利也不错。但是不像pre-ipo的
节奏,太lay back。


HortonWorks(offer):

phone1: Print all paths which sum to a given value in binary tree(including
negtive value)
         Implement hashtable
phone2:  LCA
         some basic question on Hadoop

onsite: 
        1.co-founder: implement concurrent hashmap, try your best to improve
performance
        2.三妈hiring manager: project presentation 
        3.Japanese: basic knowledge on REST api, DB transaction, ACID, CAP
                    design distributed K-V store 
                    reserve integer
        4.笑嘻嘻亲切三哥:binary tree serialize/de-serialize

co-founder 进来就打瞌睡,按JDK版本写了个简单版的给他,解释了下代码就开会去了。
三妈尼玛进来就臭脸,各种挑刺,各种刨根问底(她还真懂),到最后我把gossip 
protocol讲清楚了才有点笑容。最后一个三哥就是来搞笑的,不评价。

offer: 145k + 20k + 135k value of stock over 3 years = 210k
从第二年开始有30%的refresh,还是挺给力的其实。有一点一定要吐槽,三妈打电话给
我们公司以前的lead问他:“这货不错,我们想要他,你们以前是怎么管这货的,这货
加班勤奋么”。我已经当面说过over time没问题,我理解小公司的fast 节奏,但是她
这么背后一问就让人感觉很不爽。最后一点,全是阿三。。。
                    
Zenefits(offer):

phone:  restore binary tree from in-order/pre-order 
        string multiply
onsite: 1.ABC given “Zenefits is growing fast”, return "Zftienes is 
gwornig fsat"
          除了首位字母,中间顺序要完全随机,这道题上机写,要跑test。
          design a API how to render a progress bar
          design a login system(back end architecture)
        2.亚裔 minimum window substring preserve order
          不是leetcode那道,完全不一样的解法。上机写,要能跑test。
        3.三哥 tiny URL

感谢电面的国人大哥出leetcode原题放水!最后一个三哥态度嚣张,一边design一边反
驳说这里有问题那里有问题,问我zookeeper是什么,我以为他想考我内部的东西,结
果他说他没听说过这玩意。。。

Zenefits: 150k + 20k option(value 200k-220k) over 4 years = 200-210k
不是很给力的样子,虽然CTO亲自打电话发offer,也感觉到了诚意,聊了很久,非常热
情。我不敢在这评论Z,版上太容易拉仇恨了,不敢说。

Uber(offer, 已接受, 略)

Google(pending)

phone: 1.given an order string "abc" check if "aabdccd" maintain the order
       "aabdccd" -> true;
       "abbca"   -> false;
       2.abbre word, given a list of words, return a map contains abbre word
map to a list of original word
       abbre word means:   word -> w2d,  international -> i11l
       跟anagram差不多

onsite: 1.毛子 given "AABBCC" return "ABCABC", no same char next to each 
other
          "ABBB" -> exception
          "ABBA" -> "ABAB"
        2.国人 excel encoding, leetcode那个
          given [1,2,0,6,9] and target 81, return true if add “+” between 
numbers can add up to target. 12+0+69=81 -> true.
        3.白人小哥 java 一个数据结构改错,没什么tricky的地方
        4.三哥 abbre word again... follow up是 word->w2d, 另一个wold->wo1d, 
也就是说不能group起来,每个都是unique的
        5.毛子 maximum path from upper left to right bottom, follow up是除了
往下往右,还可以往左走,怎么避免死循环。

再次感谢国人大哥出简单题放水!Google奇怪的是没面我design题,全是coding,似乎
也没人看我简历。没什么好说的,general hire.

LinkedIn(pending)

phone: 考烂的两道 max product array 和 product exclude itself

onsite: 1.三哥校友+华人漂亮妹子 tiny url
        2.白人 project presentation
        3.三姐校友+不明种族detect intersection of two linked list
                         max points on a line
        4.国人+白男 房子上色问题,这题10分钟搞定,shadow白人看不下去了,上来
恶心了个几何题,不具参考性,因为太变态了,谁没见过能做出来绝逼数学系毕业。还
好他不是主面。
        5.host manager some behaviour + when a new version of API 上线,怎么
和client side 协调好切换版本,出问题了rollback 怎么做。

依然感谢国人电面放水。 如果recruiter没忽悠我的话应该是过了。第二轮那白人各种
赞,各种good,结果打分最低。

大概总结下,这次刷这么一轮没碰到什么难题,也没碰到不擅长的题型,基本就提笔写
的,刷到一个程度写题就是本能。。。唯一一个想了一会的就是Z的第二题。
在公司做的project可以适当放大,把没做完的也加进去,被interviewer提出问题,如
果这个部分你没有做,也要跟他说你可以怎么优化。要有over view on整个project,
尽量把握细节,讲的时候往你擅长的部分引到,这一点让人感觉你有ownership。我的
步奏是先介绍整个框架结构,project的motivation是什么,scale起来瓶颈在哪,sub-
project拆出来是怎么分的,为什么这么分,之间有什么dependency, sub-project我怎
么分配顺序的。
Design题一靠平常积累,二靠多看open source stack,当然要看细节和实现,光知道
大概没用的。

可以不喷了?

[转载 From MITBBS] sumo logic的开放型设计题,设计一个cache system

水平不行,已挂。感慨自己工作也好几年了,主持设计开发的项目/feature还是太少。
感谢版上面过sumo logic的大牛的热情咨询。

感觉设计题考cache挺常见的,大家讨论一下?中国大叔主面,很nice,年轻三哥
shadoow。设计一个cache system,要pseduo code,存储结构,API等,不要求LRU等替
换策略,需要考虑concurrent的情况。要求考虑真实的使用场景,也就是这个cache 
system码工们用起来很方便。我给的答案就是传统的hashtable的api,加上处理miss、
需要从硬盘或者数据库load的时候,做些处理确保不重复load。感觉让中国大叔失望了
:(


这种完全open的设计题最怕了,面试官很容易从你的解题过程中判断你的老练程度,
problem solving的思维方式,系统设计的基本原理,pro con的tradeoff,用code快速
描述的能力,等等。个人感觉挺难装出来的。



======================
别的几轮里的算法题:
1. 字典里有大量words,给一个query,如果在字典里能找到one edit distance则返回
那个word。followup是如果是k edit distance呢。不能对字典里的所有word做简单的
预处理(产生所有可能的k edit以后的词加入字典)。

2. 设计带历史记录的哈希表。对于同一个key下出现过的多个value都记录,每个value
都加个timestamp。查找时get(key, ts),输出value,其时间戳是在ts或者ts之前
最近的。

之前两轮店面都是树的题目,基本都挺简单的,一个稍微麻烦点的是任意叉树的序列化
和逆序列化。都要在codepad里跑过测试。

《花少》结束语

人们所追寻的,常常一览无余,而真正渴望的,深藏不露。当人们得到了很多的时候,才会发现,对于错过的那些珍贵,曾那么心不在焉。

[转载 from mitbbs] Facebook,Linkedin, Google的面经

背景: EE通信PHD,转行的,接近4年通信chip公司经验。
我都是直接找朋友要的recruiter的email,发信过去,然后他们约了时间随便聊聊就安
排店面。也有内推的,反应慢一些,但也有反应。

店面
F: add two binary string, follow up是任意进制 (最多到16进制),第一次面,脑
子不灵,加上用collabedit时把网页调成125%,改code是两行叠一起了,没法看。就没
有时间做第二题了。
本以为妥妥悲剧了,结果国人小哥直接防水让onsite,感谢感谢。
L:又是一个中国小哥,
1.maximum depth of tree 热身
2.find number in rotated sorted array
3.把一个数,比如24,写成factor的乘积组合, 2*12, 2*2*3,。。。。(这道本来
不要求,只要说思路,但是我边说思路变写,很快就写完了)


onsite
F:1.find bad version, 比如isgood(version 1) = true, isgood(version 30) = 
false, 找出第一个出错的version
   2.BST inorder tranverse
   3. 把string转化成floating number(stof)
behavior question的最后烙印来了一道按列打印tree,follow up是不用hashmap存
node的水平距离,用vector存,如何做,onepass,不准先求树的width
   4. system design: 每个record有个很大field,比如年龄,性别,爱好等。给一个
field的组合,比如小于25岁,爱好体育,query满足这些组合条件的用户个数

L:
1.max point on line/ (如何不是整数坐标如何处理,需要改写hashmap的compare) 
2.special container add/remove/removeRandom at O(1): array + hashmap

3.k-way sort given a stream iterator, vector<strream>,
4.product of other elements; 考虑1个0 和2个0 的情况
5.实现movemem( void* src, void* dest)

6.system design: tiny url
7.host manager那轮最后问了一个,如何在不影响功能的情况下,把一个data center
的数据复制到另外一个新的data center去。

G:
1. find all rotation symmetric numbers less than N digits,  16891 -> 16891, 
2. give integer, 12345, 返回 32154
    give a target  string and list of strings, find the longest string that 
has target as prefix, follow up, stream of target string, 用trie,每个节点保
留最长string信息。
3. integer array add one
    rotation abc->bcd->cde, give a list of strings, group them if them are 
rotations.
居然给我laptop,然后直接上面写,然后debug通过,给test case通过

4. given grid of colors, coordinate of a point and its color, find the 
perimeter of the region that has the same color of that point.
    print all morse code given the length constraints, short “*” takes one
, long “——“takes two. (find a bug in the code) 就是排列组合的典型题
5. design: chromecast, how to know which app can be supported? There is a 
cloud that can give the information to the chrome cast, appID, deviceID, 
cache design. 

【转载 from mitbbs】准备面试篇

首先,无干货,可略过。

其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
以看看,欢迎指正和建议。

######################################
###

再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。

北美cs top25水校ms不到两年
之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
做的东西还算可以,大数据的infra

######################################
###

除了刷题之外的准备。。

真正开始准备找工作是半年之前,我相信我在的驴比版上大部分公司都忙,所以开始的
时候进度比较慢,最开始的时候并没有主要刷题,而是列了一些我觉得必须要了解到一
定程度的system和framework来学习,我花了大概三个月时间来看一些paper,
opensource project的文档,presentation,source code和engineering blog。因为
工作中都在用,所以其实没有非常痛苦,但是尽量从design的角度来看问题会学到更多
东西,很多时候问问自己别人为什么要这样做,再结合自己真正的经历会收获很多。这
段时间也是自己对整个knowledge base查缺补漏的重要时间,只要看到不是很理解的概
念基本上都要查清楚,design很多时候其实是考察你的knowledge base和基本功是不是
扎实,没有knowledge base是很难做好design。

后面我还专门花时间来看跟Java concurrency有关的内容,joshua bloch的那本书我看
了一遍,然后又看了一遍Java concurrent library里面几个经典的数据结构的实现,
这个我觉得对我的帮助非常之大,很多东西以前模模糊糊突然会变得清楚很多,理解了
别人是怎么实现的,其实也能学会很多时候各种常见的优化是怎么做的。甚至很多
concurrency design和实现的技巧都是在这里学到的,比如之前不知道IntAccumulator
,AtomicIntArray,再比如我们都知道blockingqueue简单来说怎么实现,但是Java的
LinkedBlockdingQueue其实比较精巧,throughput较高,然后再跟之前接触过的
disruptor queue做比较,总结下来现在无非就是从最早的compareset busy wait浪费
cpu再到用wait condition节省cpu再到compareset busy wait浪费cpu但是提供更好的
throughput。另外就是直接对memory进行volatile读操作可以在很多时候节省读的时候
的锁。新的concurrenthashmap大量用到了这些,其实也提供了很多在做concurrent的
题目的时候一些重要的优化的方法。

做完这些事情之后本来想把Kafka的源码再读一下,但是时间不够了,虽然之前design
还是大体有些了解,但是我觉得hadoop,storm,kafka,Hbase,Cassandra这几个非常
典型的framework是我面试中必然要非常了解的东西,之前接触Kafka并不是非常多,所
以特意又把Kafka的paper和design doc研读了一下,然后又看了大量的其它公司的
engineering blog来了解别人都在做什么,都有什么问题。

之前没有做过很多跟web service相关的东西,所以这个类型的东西还是要看一下,
thanks god,版上有位F的大牛分享了很多有用的资料,有关最经典的几个系统的
design和实现,跟F相关的网上能找到的视频我基本上都看过一遍,文档我也都看过一
遍,基本上类似的问题都能用相同的原则来解决。

有些同学说design没有经验搞不定, 这个也对也不完全对,没有搞过确实缺乏第一手
资料,会不知道可能会出现哪些问题,但是不代表最常见的问题你没有其它途径可以知
道,大家对于各个系统的改进都是基于现有系统出现的常见问题,没做过可以,但是不
能作为不会做的借口,想要了解别人是怎么做的不是一件很难的事情。现在大部分常见
的系统整体来说都是大同小异,有一些最根本的原则其实大家都在遵循,然后区别往往
是针对不同use case的个别的优化。

所以这里我觉得比较有用的准备方法是,在弄明白一个design之前,先要做好几个准备

1. 先把一个process或者一个系统是怎么工作的搞清楚,这里是指,design一个
service需要cpu,memory,disk,network等等很多component协调工作,这些东西分别
都在什么时候用到,为什么要有这些东西,分别有什么特点。
相信大家都很熟悉有一篇文章叫做The numbers eveyone should know,在没有这篇文
章基础上的design都是瞎扯。

2. 要清楚这个design到底是为了解决什么问题,use case是什么,design一个系统根
本上讲是为了解决一个存在的problem,这个problem会有general的要求,比如latency
,比如throughput,比如load,比如哪种操作比较频繁,比如有没有consistency要求
,是不是reactive,是不是需要highly available,等等等等,这样跟第1点相结合才
能明白瓶颈可能在哪里,哪些东西可以tradeoff,进而才会有design的solution

3. knowledge base的储备要尽量够,操作系统,distributed system,concurrency这
些东西很难啃,我也曾经自学过几个大学的distributed system公开课,很多同学想绕
过这些走捷径,但是越难的东西就越有价值。知识量不够不是问题,看一点补充一点,
只要能坚持下来,到了一个时间点基本上还是可以有质变的。

所有的套路都是建立在这些东西基础之上,慢慢总结下来就会明白,在什么情况下可以
怎么做来解决什么样的问题。很多时候不需要你自己去想新的solution,但是对于现有
的solution能够做到灵活运用也不是一件很简单的事情。

简而言之,就是靠平时积累打好知识的基础+多偷学别人现有的东西+自己多总结多站
在解决问题的角度来思考,而不仅仅把这些当作面试题。

另外,我觉得就准备一般面试而言,版上有两大神贴,这两大神贴里面的内容相当的赞
,而且我也完完整整的读了所有的内容,这两大神贴现在还在第一页上

1. 就是beidapig大牛的总结贴
2. 就是另一个facebook大牛的总结经验内推贴

我对web service这一块的总结基本上就靠这两个帖子里面的内容,所以特别感谢这两
位。

以上这些事情其实工作之后断断续续一直都在做,但是集中精力做大概是持续了四个月
时间。
然后我觉得需要开始集中强化一下算法和coding。

######################################
###

有关算法coding:

在之前一个帖子说过了,LC+本版过去半年的面经。

不好意思,我不太擅长把东西整理的很有条理,所以基本上现在这些东西还是处于只有
我一个人能明白是什么的状态,非常之乱所以不好意思献丑。

但是我这里想说的是,总结的结果没有那么重要,过程才是最重要的,如果你看别人面
经的目的就是为了明白这几道题目或者期望面试碰到原题,我觉得面经是看不完的。这
个版上的资源非常之丰富,其实都不需要完全消化就能很容易拿到offer。

看一道题目就理解一道题目而且能够跟之前类似的问题融汇起来才是目的,其实看完版
上半年的面经并没有那么难,我这件事情坚持了一个多月时间,每天晚上看四,五个小
时,每个帖子每道题目,所有的回帖,都仔仔细细看过,这是我感觉算法突飞猛进的一
个重要时间段。

还有现在很多面试的很多题目不是偏向于算法而是coding的基本功,这个没办法就是多
练习,越是麻烦不好写的题目越是要多练习,其实都有规律可以遵循。

版上的难题我一个都没有遇到,我觉得LC中等到中等偏上难度的题目应该是大部分面试
的平均水平,花费大量时间在某些难题上面不一定有意义,还不如把基础打的更佳牢固
些。如果你面试中被问到难题,基本说明面试官在面试前就对你不是非常认可,需要用
一些比较难的题目来考察你。

我本身也面过不少candidates,所以我相信这个是大部分面试官常见的思路,其实真实
的事情是很多时候面试官想让你过你就能过,不想让你过你怎么样也过不了。面试不是
考试,不是题做出来就能100分,况且有很多题目都没有评分标准。

所以我说,刷题只是整个面试过程中最最基本的部分,只是必要的一个条件,远远不是
全部,如果能力够了刷题刷的不好也照样拿offer,大家互相什么水平随便聊两句都知
道个差不多,并不是所有人都喜欢面算法面刷题。

######################################
###

后面就真正进入面试的阶段,然后为了心无旁骛破釜沉舟我把之前没用的假期都用了,
然后开始全职专心致志搞。

面试的时候我的策略是先面练手的公司,然后中间状态最好的时候面最想去的公司,最
后再冲击难一点的hot preipo,不过发现面试的时间基本上自己也说了不算,之前做好
的计划基本没用。

最后三个周我基本上没有太刷题,最多就是看看之前掌握的感觉不是特别好的内容,然
后随便东戳一下西戳一下看看新的帖子,每天再练习两个设计题目,如果需要保持手感
就手写几道题目。每个公司onsite之前我还会把glassdoor上的面经浏览一下,主要是
为了心里有数,不会紧张。
所有的onsite基本上都在最后的两个周时间,这段时间比较艰难。

有关其他:
相比刚毕业的时候,这次找工作还是有一些感触比较深的地方:

1。简历非常重要,即使是去面FG这种大公司,很多时候面试结果在真正面之前就决定
了大半,如果简历还拿得出手自己对做的东西非常熟,有很大加成,所以请大家还是要
刷刷简历,好好准备。我有好几次都是聊简历相关的东西一轮面试就糊弄过去了,面试
官一般也不会为难。

2。找工作请找靠谱的朋友内推和找目标公司的recruiter,recruiter大部分是非常帮
忙的,所以请在一开始的时候对他们好一点,他们如果觉得你有戏会尽力帮你拿到
offer。recruiter在面试中起到的作用可以非常大,他们帮你安排面试官,他们可以看
到你的feedback,他们甚至可以有比较好的私人关系帮你match好的组,所以,在拿到
offer之前,注意是之前,装装孙子没有坏处。拿到offer之后主动权就在你自己手里了
,大局已定后双方的地位会互换,negotiate offer这个环节其实就一条。。。有
compete offer你就牛逼,没有你就。。。

3。面试过程也是不断学习的一个过程,这也是我为什么拼了命也要面这么多公司的一
个原因,因为我想多知道一些细节别的公司是怎么做的,所以面试的时候不要担心大胆
问,很多问题都是他们要解决的真实存在的问题,也是你将来可能会碰到的问题,如果
面下来10个公司只是这些总结下来的东西已经可以帮你再搞定一个面试了

4。另一个我觉得很有帮助的是有一群志同道合的朋友和能够指点自己的大腿,在整个
工作过程中我觉得从我的同事身上学到了很多很多东西,帮助很大,这点我不得不赞一
下我之前的驴的所有中国人,可能因为都被三哥压迫所以大家特别团结,平时对于各种
技术问题的交流都很到位,没有人会有所保留。现在我那一拨的人基本走的差不多了,
我算走的比较晚的,一般都是越牛的人走的越早,我最终的offer在所有人里面也就是
个中等水平吧。

5。运气,很重要,同样的人换一个环境可能是完全不同的结果。我之前问过一个大牛
找工作最重要的是什么,曰:运气。现在我很相信这个。。。

All in all,我不是牛人,我不是国内top20毕业也不是北美top20毕业,我本科也不是
学cs的,但是我特别相信版上之前一位前辈的话,大家能来到美国读一个decent学位说
明大家的智商都没任何问题,很多时候结果怎样只取决于自己的决心和毅力有多强大。
只要肯努力,结果就不会太差。

[转载 from mitbbs] 回报本版,前段时间骑驴找马FGU等公司offer面经总结

前段时间骑驴找马终于告一段落,感觉本版的技术贴和面经贴帮助非常之大,也非常感
谢共享资源的各路大牛。希望提供一些信息和个人感受给还在找工的童鞋,有帮助最好
,但是毕竟本人资历尚浅,如果有不对的地方也请轻喷。

背景:
ms毕业不到两年

主要申请公司:
offer:facebook,google,uber,palantir,sumo logic,walmartlab,yahoo,
amazon,apple
reject:dropbox

主要几个包裹:
U:                    145k base + 25k股 RSU
F:                    150k base + 40k signon + 10%bonus + 260k美元 RSU
W:                    165k base + 50k signon + 20%bonus + 35k美元 RSU每年(
这个略复杂,相当于每年35k美元RSU的refresh,但是每次refresh分四年给)

再上各个公司的面经和感受:

Yahoo:
最早面的公司,面的是Flurry Team,Yahoo去年收购的一家在城里的小公司,所以不一
定有代表性。因为re-org我两个月之后才拿到offer,中间还给我match到其他team几次
,Yahoo比较动荡,个人也不看好。

电面:
和director聊了有两个小时,无coding,问了很多之前project内容和hadoop相关的内
容。
最后讨论了一道design,如何设计distributed key-value store,因为他们主要用
HBase。

Programming Test:
Validate Soduko Solution,从文件读solution,尽量用production标准写程序。

Onsite:
五轮Onsite没有coding,全是问实际问题怎么解决和design。
1. 如何设计一个priorityqueue service,client可以submit job request然后server
按照priority执行
2. 需要一个key-value store with 1M qps,most read,1ms 99% latency,如果用
HBase的话会有什么问题,怎么解决
3. 给很多整数,如何用mapreduce找median,如果是很多float数,可以有一定的误差
,如何找
4. Programming Test的扩展,如果soduku matrix非常之大怎么做
然后还有一大堆针对hadoop的各种情况下怎么optimize的问题

onsite完了之后他们director说very positive,然后就开始re-org两个月。Flurry做
的东西其实挺有意思,mobile analytics platform #1,我感觉他们engineer人很nice
,水准也非常不错,可惜没缘分。

############################################################################
###########

Apple:
练手公司1,Apple可以同时面很多组,每个组有各自的recruiter。我把简历递了之后
陆续有10个组联系我,然后每个组基本上都是onsite之前两轮phone,一开始没经验联
系了4个组后来发现实在体力吃不消,光电面就8轮。最后3个组要onsite,这里我犯了
一个错误,告诉他们我在面其他的组,一旦他们知道你在面其他的组就不跟进了,打死
不回email。所以最终我只onsite了一个组。

电面:
1.给平面一堆点,把所有在同一条直线上的点group在一起,求出所有的group
2.一种encoding的方法,如果一个byte第一个bit是0,比如 00000000,那它自己表示
一个字符,如果一个byte第一个bit是1,比如 10000000,那它和它后面紧跟的byte表
示一个字符,现在给一个byte array,判断最后一个字符是一个byte还是两个byte组成。
3.parse message from byte stream,message format是前4个bytes组成的int值表示
message的长度L,然后后面连续的L个byte是message真正的内容,每个message都是这
样表示,需要一边读byte stream一边parse每个message
4. 两个table做join有哪几种方法,分别有哪些drawback
5. merge two sorted list
6. sqrt(double number, double epsilon)
7. auto completion implementation using trie
8. edit distance
9. Implement blockingqueue
10. how is a hive query transferred to mapreduce jobs

Onsite:
1. given a list of pairs, pair.first 表示parent, pair.second表示child, 
reconstruct the tree, return the root node.
2. auto completion - design the service
3. design a service, accept stream of events, each event has a type and 
timestamp, need to support the query of top k most frequent types in a query
specified [start, end] time range.
4. closest number to target in BST
5. validate soduku / solve soduku, and optimizations
6. 给一个json object,给一个wildcard path with ‘?’ as arbitrary name,比如
a.?.b 找到所有符合path的objects

Apple一般onsite的时候4轮tech interview,中午的时候将来的manager带着吃午饭。
如果tech这4轮面的好会有第5轮见到hiring manager,如果有这一轮基本说明offer没
啥问题了,这轮会是一堆behavior。如果第5轮也没啥问题会有第6轮见大boss,继续
behavior,会问之前做过的project有多牛叉,会吹就行。

同等级下Apple的offer远不如FG给力,而且match不上去,bonus也不会写在offer 
letter里面,虽然据说每年的refresh有些组相当多,但是感觉整体上跟FG还是差距比
较大。而且组跟组工作强度差别也很大,有些组忙死有些组闲死,不过software的组一
般都还好,感觉大部分人精神状态还是不错的。

就engineer水平来看,我有遇到水平相当不错的面试官,但是整体水准远不如FG。
他们各个组做项目是完全分开的,基本没交流。做东西完全是product driven,不过
engineer一般需要fullstack,需要自己end to end维护一个product,这点对有些人可
能还比较有吸引力。

############################################################################
###########

Amazon:
练手公司2,我面的是marketing solution和ads相关的team。大公司周期很长,感觉
recruiter不是很上心。

电面:
三哥,但是感觉还行没黑。
1.用trie来解决求dictionary里面所有符合given prefix的word。然后又扩展到prefix
里面有wildcard的情况,然后继续讨论如果要design a system做这个事情怎么搞,需
要注意哪些问题。

Onsite:
居然没有遇到三哥,除了一轮老中外其他都是老白,每一轮开始都是至少15分钟的
behavior,而且每个人还能换着花样问不一样的问题,感觉大部分脑细胞都花在这些没
用的东西上面了,所以感觉很不爽。
1. OOD Restaurant Reservation System
2. Merge K Sorted List
3. K Sized Sliding Window Sum/Minimum Value
4. 给一个css file里面很多class,然后class name里面其实很多重复的,怎么
compress用尽量最小size的string来表示,这样传输的byte比较少。
5. shorten url system design
6. longest palindromic substring
7. robot moving from topleft to bottomright corner of a matrix,matrix里面有
些cell是障碍物不能通过,只能往下或者往右走,有多少种方法。
8. 之前做的项目,和我之前坑爹公司的architecture

相比起他们的behavior问题,我觉得亚麻的engineer水平相当一般,很多design 
principle都不知道,可能因为他们内部都直接用aws很多细节都不需要考虑,也有可能
跟我面的组有关系,如果面的是aws会好些吧。

亚麻最后给我senior title,但是package跟其他几家比起来差距略大,所以也就没再
继续谈。

############################################################################
###########

WalmartLab:
我面的是walmartlab里面仅存的几个不是三哥的组,通过靠谱的朋友内推。
面试题整体难度也还好,算法基本上都是常见题目,国人面试官都非常非常非常nice。
只说其中几轮比较有意思的吧
1.topological sort
2.design web crawler system,how to scale,what would be the bottle neck and
how to solve the problem
3. 如何用semaphore或者condition variable实现3个process p1, p2, p3,p2必须要
p1结束才能运行,p3必须要p2结束才能运行
4. bloom filter 如何implement,estimate false rate
5. what is the best design pattern do you think and why

他们onsite有一轮会是跟product manager聊天,就是瞎扯。一个小时我都在绞尽脑汁
找话题,应该是类似culture fit吧,看看你是不是比较容易融入team。

walmartlab是第一个给我比较decent offer的公司,cash给的很多,所以其实我很感激
,而且我面的组的work life balance极好,我见过的最好的没有之一,onsite居然有
两轮是video因为面试官WFH。平时干活也非常自由,没有OKR,没有deadline(是的你
没看错,啥都没有,performance完全老板说了算)。
不去walmartlab的原因是我觉得他们实在缺有经验的engineer,而且很多做的很多东西
都是实验性质的,没有明显的business impact,现阶段我还是比较想去一个大腿比较
多的地方抱一下。

############################################################################
###########

Sumo Logic:
一开始看到这家公司里面好多MIT毕业的人,而且听说他们bar很高,所以一开始也只是
想拿来做一下benchmark。他们基本上都用scala,如果懂一点scala效果会比较好但是
不懂对面试也完全没有影响。

他们的面试是先一轮phone,然后两次onsite,第一次onsite2轮,第二次onsite3轮,
第一次onsite过了才会有第二次onsite。第二次onsite每一轮会有两个面试官,每个面
试官都会出一道题目。

电面:
1. 两个binary tree,每个node存的值有两种可能,1或者0,把两个tree对应node做or
操作。
极为简单,扯了一下immutable data structure然后聊了一会之前做的东西就过了。

onsite 1:
1. 纯聊project和讨论他们现有的data ingestion架构,刚好他们最近想用Kafka所以
就这个话题聊了一个小时,最后没时间做题就结束了
2. 小三哥,但是也不黑。
given a list of intervals,query if another interval is totally covered by 
the list of intervals。
totally covered是指整个区间都被某些已有的区间 cover了。
比如如果有 list of intervals = 【(1, 4),(2,8)】
given interval【3,6】就被完全cover了。
然后扩展到design a system来做这个事情,可以query,也可以insert interval,假
设query操作的频率远远大于insert操作,并且interval的数量非常非常多。

onsite 2:
1. 有意思的题目1,设计Bi-directional LRU cache data structure,既可以lookup 
key to get value,也可以lookup value to get key,还支持set(key, value)操作,
后面又加了条件,concurrent的情况下,会有什么问题,如何改进,假如set这个操作
的频率远远小于get这个操作的频率,需要写代码实现。
2. robot from topleft to bottomright LC原题,无障碍和有障碍
3. given a list of sets,find all pair of sets having any intersection
4. 有意思的题目2,设计caltrain system,要实现caltrain上车下车刷卡扣钱整个功
能,assume每个station都跟一个central server相连,要处理如果有network 
partition怎么办,eventually车费还是要charge到账户上,但是不能影响partition的
station正常运作。要处理某些人下车没刷卡怎么办,followup可以非常多
5. 有意思的题目3,仍然是设计一个cocurrent环境下的time leased cache,但是有些
区别,假如delete操作是一个daemon thread来做不用太多考虑,但是get(key)操作的
逻辑是如果key不在cache里面,需要一个非常expensive的操作把对应value load进来
,如何让这个load的操作对同一个key尽量少发生,需要写代码实现。

这家的题目我觉得非常有意思,engineer都超级nice,感觉我见过的人的能力都非常不
错,年轻一点的反应非常快,年长一点的经验非常丰富。整体上看三哥并不多,虽然
engineering vp是三哥。
这家很有诚意,最后给我的base跟walmartlab差不多,再加上很难估值的option。他们
觉得他们的bar很高,能过他们面试的人不多,所以一旦你过了他们面试,要做好被他
们的recruiter不停骚扰的准备。
有关这个公司,在其他帖子里面我提到过,虽然engineering vp是个三哥,但是感觉还
比较靠谱,不像某些三哥吹牛没有边际,对于整个公司发展的前景比较有数,business
model也很promising,最近刚刚拿到一笔80M的投资。

############################################################################
###########

Palantir:

号称湾区面试最难的公司。但是again我运气比较好没有碰到很难的题目。我觉得这家
公司有点吹的过大了,本身做的东西根本没有什么技术含量,里面都是一群没经验的
stanford小年轻,都是自我感觉超好。另外去这家公司要做好准备每周工作60hours。
估值150亿了还给option我也是醉了,能上市不?我的看法就是这家公司基本就是坑,
从哪个角度来讲都不值得去。

他们的onsite上午会有3轮,然后中午吃完饭后会有一个小时的demo(因为实在没什么
意思所以我差点睡着了),如果上午过了下午还会有1 - 2轮,一般下午会有一轮
system design,另一轮是见hiring manager,如果上午没过demo结束就可以回家了。

电面:
万年不变的电面题,给一个array,问有没有duplicate
follow up1,只要index的距离 < k并且value相同就算duplicate
follow up2,只要index的距离 < k并且value的绝对值差 < d 就算duplicate
follow up3,follow up2能不能有time complexity O(n)的解?

Onsite:
1. OOD astroid game,就是飞机打石块的游戏,石块可以任意形状可以移动,飞机撞
上就挂了,飞机可以发射子弹,子弹打上石块会把石块分成多个小石块按照不同方向和
速度移动。要写伪代码。
2. 每个person有一个list of intervals,表示busy的时间段,问最busy的一段时间分
别都是谁busy。
3. 一个描述起来不算简单的题目,但是算法不难,在版上看到过但是细节记不清了,
好像是给一堆stock profile然后算profit
4. 一个2d matrix,被分成好几个区域,区域之间都是value为0的cell,每一堆
connected的非0cell算是一个区域,问和最大的区域是哪个,要设计API,怎么用json 
return结果。
5. system design又是 distributed key-value store,万年不变的题目,后来没啥好
聊的只好跟面试官扯他们的那个atlas,distributed transaction layer,没办法想拿
offer跪舔还是需要的。

基本上每个面试官都是一副老子很牛逼的样子,一问他们到底做了什么牛逼的东西马上
支支吾吾说不出个所以然。他们的offer也没诚意,150k的base + 25k signon + 
55000option,没谈就直接拒掉了。

############################################################################
###########

Dropbox:

Dropbox的面试题都是从题库出的,但问题是他们的题库并不大。所以,我可以负责任
的说,你在这个版上找到的面经题目,你在面试过程中绝对能碰到。另外他们复杂的算
法题目并不多,但是大部分是跟concurrency有关的问题。

一般标配是 2轮电面 + 6轮onsite,6轮onsite中居然有两轮是behavior和culture fit

另外,他们面试的要求都是要写能run的code,要写完整的solution,不能写个主要
function就完事。

电面:
1. 给一堆file,如何比较有效率的把内容完全相同的file group到一起,file可能非
常大
2. 被人面过无数次的电话号码转成string,然后再word break那个题目

Onsite:
1. log_hit(), get_last_5mins_hits()那个题目,concurrent怎么搞
2. token bucket,假设每x秒提供一个token,然后外面可以申请任意数量的token,如
果token不够就block,要求concurrent情况下,不能有专门的thread产生token,怎样
用最简单的方法实现
3. web crawler,要分析可能的bottleneck,然后转化成concurrent运行的版本,写
runnable代码。
4. system desgin那一轮是两个三哥,轮流轰炸了一个小时,把我之前做的所有东西完
全推翻了,所以这一轮没结束我就知道肯定挂了。

############################################################################
###########

后面这三个公司是整个面试过程中给我感觉最好的三个公司。

Uber:

Uber的效率不是一般的牛叉。我从刚开始被Uber联系到最后拿到offer基本在一个周之
内搞定。面完了Uber之后真的有点心动,因为面我的人我觉得都很牛逼,人也都很超
nice,非常乐于提供很多关于Uber的信息,整个氛围非常积极向上。老板虽然是个三哥
但是也没有任何能吐槽的地方,他手下现在也基本都是老中。

电面:
一般电面会是hiring manager,除了问了一下之前做过什么之外只有一道题目:
OOD card deck,要现场deug,需要能运行
电面后一个小时通知我可以onsite

Onsite:
onsite一般是5轮,中间老板带着吃午饭
5轮中必然有一轮是只讨论之前做过的project,要做好准备,一定要对自己之前做的东
西特别熟
另外我面试过程中问了不少怎么设计一个系统解决Uber实际问题这种题目,很新颖很有
意思
1. 问了我不少关于storm的问题,比如storm怎么保证exact once/at least once 
semantic,如何做timed window join,因为我简历上有相关的东西,然后让我用storm
来做一个比较简单的sliding window count。
2. big integer multiplication,要求现场运行代码。
3. longest increasing subarray,longest increasing subpath in a tree,path只
能从root到某个leaf
4. boggle game,given a boggle board and a dictionary,find all words on the
board,
follow up,如果dictionay 不变但是board不停的变怎么优化
follow up,如果board不变但是dictionary不停的变怎么优化
5. given a matrix only containing 1 or 0,find how many rectangles are 4个角
都是1
6. how to design a system to automatically detect hotspot on geo graph, a 
hotspot is an area such that 打车的request远多于available driver的数量
7. how to design a system to detect if dispatch algorithm has some bug,
dispatch主要是收集所有打车request和available driver的信息然后决定哪个driver
哪个客人

Onsite过后两个小时通知我有offer了,如果onsite过后一两天之内没通知的话,基本
上说明你的waiting list上,要等排在你前面的人据掉offer才可以继续下一步。

############################################################################
###########

Facebook:

initial round我是直接去onsite的,但是根据其他朋友的经验似乎电面或者onsite影
响也根本不大,因为第一轮基本只要没有太大的纰漏都会过。

Onsite:
一共5轮,如果是4级的话会是3轮coding,1轮behavior和1轮system design。因为偏
infra, 所以我有3轮是三哥,当时已经做好挂的准备了。
1. move all 0s to right end of the array
2. decode way
3. binary tree inorder iterator
4. determine if there is a subarray sum to target number
5. convert integer to string,1000 to “one thousand”
6. system design - design facebook music system,只需要design service tier,
两个API
get_top_10_list_music_ids(int64 userid) - return top 10 most frequent 
listened music ids for a given user last week. 这个call在load页面的时候要进
行,所以对latency要求比较高。
record(int64 userid, int64 musicid, int64 timestamp) - 每当user听一首歌,就
需要记录下来,这个可以asynch进行,需要eventually consistent,但不需要每听一
首歌马上就能反映到上一个call中。要做各种spec和resource的estimation。
7. 抄dropbox那个问题,get_hits_last_5mins(), record_hit(),但是后面又扯到
system design,如何thread safe,如果是districuted syste怎么搞,能想到几种方法
8. behavior那一轮基本上围绕着的主题是,你之前碰到什么难解决的问题,怎么解决
的,你学到了什么,production有过什么比较傻叉的bug,怎么避免的。你之前做项目
有没有cross team的,你怎么说服其他team听你的,等等。聊得过多导致最后没有时间
所有这一轮没有coding

我觉得我的运气很好,再次没有碰到很难的题目,尤其是算法。

############################################################################
###########

Google:

狗家如果真的想快的话还是可以的,我从开始被recruiter联系到offer也是一个周之内
搞定。
狗家和F家整个感觉都很好,面试官都很乐意帮忙,而且明显感觉到水平跟其他公司不
一样,技术功底非常扎实。

再次运气很好所以没有碰到很偏很难的题目,基本上就是水过了。其中几道比较有意思
的题目:
1. 一个正整数可以表示成其他几个正整数的平方和,给任何一个正整数,求最少的那
几个正整数,平方和是给定的数,比如14 = 1^2 + 2^2 + 3^2,如果给的数是14,应该
返回(1,2,3)
2. 给一个dictionary,然后可以support的query是,给一个string,返回在
dictionary里面包含给定string的所有character的最短的string
3. 如何设计google login system
4. web crawl的时候如何判断两个document是相同/相似的。

抱歉很多细节实在记不清了,表达能力也有限没办法在这个帖子里面说的很明白。如果
大家有问题我会尽我所能回答,谢谢。