百度机器学习实习三面试题及经验

时间:2019-08-19 来源:www.toryburchsora.com

?

点击上方的“机器学习算法与Python实战”并选择“热门”公开号码

牛网网

链接:nowcoder.com/discuss/17

完成笔试后,我觉得我没有参加比赛,而且我没想到会收到面试消息。

一方:

非常温柔的小弟弟

1. xgboost和gbdt有什么区别?这方面非常详细,例如,xgboost如何执行并行加速,每个拆分叶节点如何确定特征和分割点。

2,LR手推,包括最大似然概念,为什么我们可以在最大似然时乘以,以满足独立和相同的分布?然后梯度下降并更新重量。在这里,我个人说迷你批量渐变,SGD等等,说我在这里编写代码并希望展示自己。

3,结合项目,谈谈如何选择功能,特征工程,如何处理非数字,高维后的一热。问:你想用xgboost标准化功能吗?我这里也有xgboost。我觉得xgboost实际上不需要对功能进行高级预处理。当我谈到这个原则时,我没有再问过。

件gan的原理。损失函数的创新点。

5,绘制googlenet的结构。谈谈googlenet与之前网络的区别。

6.为什么googlenet使用小卷积内核? A,两个3x3相当于一个5x5,可以减少参数的数量。

7,代码问题,反向链表,树级遍历(说出想法,用过的问题),完整安排(123,321,213)。代码部分编写得非常慢,但它基本上是由这个想法编写的。

8,LR和SVM的区别。

9.为什么SVM可以处理非线性问题?

一方过去了,主要是面试官非常好。说我的代码需要加强,有想法,但它很慢。

双方:

与双方的小弟弟交谈非常有趣,人们非常善良。

1.询问爬虫项目和特征选择问题,主要是如何改善高维特征。反爬行动作机制。

2,仍然是xgboost和rt以及gbdt三重问题。这部分炖煮的食物感觉它非常全面,所以两位采访者都非常满意。

3.分割节点时如何处理决策树和分类决策树。

4,各种排序的时间复杂度(最好是最差和平均值),空间复杂度,写入合并排序(这写得很快)。采访兄弟说你的代码相当不错,楼主实际上是回来的,只能说这种非常基本,小弟说你觉得这太简单了?房东说你不能这么严厉地测试我,面试官实际上没有问过代码。

5,打开问题,楼主是不是在做nlp而是问怎么做这个模糊的搜索从中国到中华人民共和国,小弟弟一直在指导,人真的很好。

6,手推LR(楼主真的很幸运,这两个话题实际上是一样的,快乐答案)。

7,协作推荐,usercf和itemcf。

双方都比较容易,面试官很开心,人真的很好,我没想到会过关。

三方面:

三面的感觉是一个技术大牛问,很深,露实际上是第二次采访,经验很少,答案很糟糕。

1,亿级文件,每行是一个字符串,在单个文件中,字符串不重复,两个文件的交集。露水真的不是,在哈希原理的指导下等等。

2.推荐视频为1亿用户。

3.如何处理高维稀疏的特征。回答维度。当被问及是否会嵌入时,说我在word2wec中听到了单词vector,但它不会。

4,xgboost深入探究了什么。

5,代码问题,很简单但露露说了两点,代码已经写好了很长时间,我真的很好用渣T,T。反向数组找到最小值。

在三方结束时,我回去等待新闻。我显然觉得我在露水面前对TAT非常不满。但是,这是一个改进,所以我将进入三个方面。提出的问题非常基础。我更注重手写代码的能力和思维能力。我希望每个人都能得到满意的报价。