0%

面试描述

  1. 自我介绍. 自我介绍之前网络十分不好, 垃圾电脑. 劝大家面试前一定检查好网络状况. 否则很影响面试官心情.

  2. 自我介绍完了之后问看你的专业是大数据分析, 为什么不去做模型做算法?

  3. 说一下大数据的各个组件和功能吧

  4. 说一下mapreduce或spark分布式计算的原理

  5. 写个题吧, three sum, 不能重复, 升序排列. 这里一定要记住去掉重复的组合

    1
    2
    3
    if(i > 0 && num[i] == num[i-1]){
    continue;
    }

    1
    2
    3
    4
    5
    while(left > i + 1 && num[left] == num[left - 1]){
    ++left;
    }
    //面试的时候这个条件写错了, 怎么运行都不正确, 后来面试官急着开会, 让我改完发他邮箱, 才发现是这里的问题.
    应该为 while(left > i + 1 && left < num.length - 1 && num[left] == num[left - 1])

    1
    2
    3
    4
    while(right < num.length - 1 && num[right] == num[right + 1]){
    --right;
    }
    应该为 while(right < num.length - 1 && right > i + 1 && num[right] == num[right + 1])
    阅读全文 »

  1. 自我介绍

  2. 简单问了下项目, 因为面试官也不是搞后端的, 没太深入的问.

  3. 问了下MySQL有哪些引擎, innodb和myisam有什么区别

  4. 熟悉linux吗? 实习里shell中一般用linux哪些命令

  5. 怎么查看服务器的负载情况? top, top命令的前3行包含什么信息?

  6. 怎么查找一个名为a.txt的文件在哪个位置? find / -name "a.txt"

  7. 浏览器中输入www.qq.com会发生什么, 流程说一下

  8. http返回值502错误码代表什么意思

    1
    2
    3
    4
    5
    然后又介绍了对方的组. 面试半小时就结束了, 出奇的快.
    总体感觉就是面试官会的我不会, 我擅长的面试官不擅长. java没问, 大数据没问, 编程题也没问.
    希望能过吧.
    本来以为运营开发是和数据开发一样的工作, 现在看起来很像运维开发.
    但是很想和进去体验一下啊, 容器化,微服务,k8s,听起来就很cool的样子😈😈.

  1. 自我介绍
  2. 查找进程id ps -ef | grep "process_name"
  3. 刚才的ps命令里参数-e-f是什么意思
  4. ps 命令里大写的 -E参数和-e有什么区别
  5. 查看端口号的命令?
  6. netstat命令用过吗? 做什么的. (用过, 但干什么的忘了)
  7. lsof命令?(我听都没听说过)
  8. 查看cpu,内存的命令? (top, free)
  9. 查看磁盘使用情况的命令?(df, 我一开始回答的du, 后来问du和df的区别的时候才指出我说反了)
  10. dudf区别?
阅读全文 »

面试描述

  1. 自我介绍

  2. 自我介绍完了之后什么都没问直接让写题. 大数相减:给定字符串表示的两个正整数,长度很长,求差值。 和面试官交流后得知字符串中只含0-9的字符, 并且没有前导0, 即没有”000102”这种情况.

    String subtract(String a, String b)

    结果一定要注意去除前导0, 比如10000-9999这样的, 要把前面的0去掉 我一开始就忘了, 在面试官提醒下才想起来

阅读全文 »

面试描述

这次还是挺悬的, 幸亏编程题想出来了, 想不出来就gg了

  1. 自我介绍
  2. 问了实习中做的工作内容, 实习里面spark怎么用什么的
  3. spark了解的多吗, 讲一讲spark执行任务的流程
  4. 从哪里可以看出spark executor里面任务的执行情况?
  5. 又问到DAG图执行的过程, 这里我没太懂面试官的意思, 心想DAG图还有什么执行过程? 然后就回答从textFile()方法或者persist()开始. 后来听面试官的解答才知道问的不是这个, 问的知识点是RDD的惰性执行操作. 从最后一个rdd开始求出需要什么父rdd, 然后依次向前执行, 不action不执行.
  6. 实习里面kafka怎么用的?
  7. kafka实现高可用的方式?(分区机制, leader和follower,ack参数)
  8. kafka选举?(kafka控制器, leader epoch)
  9. Java线程池(7个参数, 提交一个任务会经过怎样的流程)
  10. JVM垃圾回收算法. (说了三种, 和CMS收集器). 又让讲讲G1收集器
阅读全文 »

面试介绍

应该是近期最后一场面试了. 面试官人很好, 就是约面试太慢了. 我12.09投的简历, 12.17才开始的一面, 12.22才开始的二面. 相比之下网易传媒就快很多, 12.09投的简历, 12.11一面, 12.14二面. 以至于我答应下来了offer这边的面试还没开始.

面试内容

首先还是按套路出牌, 自我介绍. 介绍完了之后面试官问大数据开发有很多领域, 对哪些感兴趣, 我回答的是偏业务的开发, 而不是数据仓库的开发和运维.

  • 问的第一个就是如何用mapreduce实现下面的问题
1
假如有很大的数据, 比如4TB, 数据中每一行有多个列. 现在要求出对于指定的第i列, 求出所有行的第i列的数据之和
阅读全文 »

1. 面试描述

这是我人生的第三次面试. 投的这两家网易的大数据开发实习岗都接到面试通知了, 但是没想到爱奇艺竟然在简历关挂了, 给我的理由是人已经招满了. 不知道是真的招满了还是简历关就被刷了.

阅读全文 »

0.

先说这次凉的教训吧,

简历上的东西一定要会, 不管是不是和面试的岗位相关!!!!!

简历上的东西一定要会, 不管是不是和面试的岗位相关!!!!!

简历上的东西一定要会, 不管是不是和面试的岗位相关!!!!!

这次我面试的是大数据开发, 本来以为不会考机器学习算法, 结果大部分时间都在考算法…..

主要原因还是在我, 不应该在简历上写那些半懂不懂的东西, 我本来以为我在简历上的一个Python 神经网络的项目不会被问到, 结果整个面试过程中都在问. 问到了tensorflow (被问到这里的时候就已经有种不好的预感了), 问到了LSTM和GRU模型, 我只会LSTM, 然后就讲了一下LSTM大概的结构, 然后又问我LSTM那几个参数是怎么算的. 当时我都懵了, 心想大数据开发岗也要问这么深的吗, 因为这个项目是我2020.5月份做的, 所以肯定是记不太清具体的算法的. 后面问了个 所以就理所应当的凉掉了这次面试.

阅读全文 »

1. 面试描述

这次是网易传媒大数据开发实习生的一面, 也是我人生中第一次面试, 很紧张, 自从接到面试通知之后就开始一直在准备.

但是还是紧张. 巨紧张.

阅读全文 »

ArrayList阅读笔记

这是我阅读的第3个源码类, mark一下吧.

建议如果阅读代码中的笔记, 将下面的代码块拷贝到vs code或idea上. 因为在markdown的代码块中宽度有限制, 会影响观看效果.

阅读全文 »