首页 > 快手运营 > 【面试招聘】快手 AI算法岗面试及答案解析
2021
01-18

【面试招聘】快手 AI算法岗面试及答案解析

  之前文章讲过8种常见的方法上采样下采样二分类变成多分类等多模型方法。

  随机对数据进行样本采样和特征采样。这个随机森林的内容之前的文章也讲解的非常详细啦。下面文章比较长内容比较全。

  这个我不太确定当时的回答是平均池化层会让特征图变得更加模糊最大池化层反向传播中计算量会小于平均池化层最大池化层会增加一定的平移不变性和旋转不变性给卷积网络。

  根据相关理论特征提取的误差主要来自两个方面

  GCN图卷积网络也可以起到这样的效果但是对GCN了解的不多。

  我们可以知道当原始数据不同维度上的特征的尺度单位不一致时需要标准化步骤对数据进行预处理。

  大家看上面两只猪对于人来说它就是两只一样的猪只是图片的灰度或者曝光度不一样罢了于是我们都给它们都标注为“社会人”。虽然我们人眼看起来没有什么毛病但是对于CNN网络来说他们的特征很可能不同。这时候一般会对图片事先进行一个Z-Score的标准化减去均值处以标准差是不是很多朋友都不知道这个方法的学名。 把不同的图片映射到同一尺度下因此上述问题就从像素值不同的问题转化成相似的特征分布的问题一定程度上消除了因为过度曝光质量不佳或者噪音等各种原因对模型权值更新的影响。

  另外一个原因是一个图片RGB三个通道往往三个通道的数据分布不同。比方说可能一个图片的R的数值偏大这样就会导致反向传播的时候图片R通道的梯度大更新快。R通道就会占据模型判断的主导地位。而下一张图片可能是绿色G比较大更新较快从而产生一个类似学习率不稳定的问题。

  这道题一开始问懵了。因为之前的几次面试基本上问的都是如何解决过拟合问题。过拟合问题之前也整理的很好了突然问欠拟合宕机了。不过这个问题也不难这里简单说一下个人回答的思路

  添加其他特征项有时候我们模型出现欠拟合的时候是因为特征项不够导致的可以添加其他特征项来很好地解决。

  添加多项式特征这个在机器学习算法里面用的很普遍例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。例如上面的图片的例子。

  减少正则化参数正则化的目的是用来防止过拟合的但是现在模型出现了欠拟合则需要减少正则化参数。减小其他的正则化参数比如树模型中的参数叶子结点中中最小样本限制树深度限制等等

  增加模型的复杂度卷积网路哦加深加宽boost模型增加训练的迭代次数。

  Dropout 是在训练过程中以一定的概率的使神经元失活即输出为0以提高模型的泛化能力减少过拟合。

  Dropout 在训练时采用是为了减少神经元对部分上层神经元的依赖类似将多个不同网络结构的模型集成起来减少过拟合的风险。而在测试时应该用整个训练好的模型因此不需要dropout。

  这里我回答错误了因为我回答成了是在测试的时候对输出数据乘上p保证训练和输出有大致的期望。其实是在训练的时候除以1-p作为补偿而测试阶段不做处理相当于去掉dropout层

  往期精彩回顾 适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑 AI基础下载机器学习的数学基础专辑获取一折本站知识星球优惠券复制链接直接打开本站。加入微信群请扫码进群如果是博士或者准备读博士请说明

  channel 关注粉丝: 地球村长,感谢提供的材料,经过小编编辑后与大家一起分享。技术1面1 Java水平怎么样?2 问Python给自己打多少分?Python多线 线 不同进程之间数据能共享吗?5 Numpy和pandas做了什么?他们有什么优缺点?6 五行五列二维数组,手写代码输出每行每列的最大值、最小值、平均值、方差7 问Redis数据...

  考察数据科学家深度学习水平的30道题 特征工程 离散、连续特征一般怎么处理(onehot、归一化、why、方法 等); 特征变换、构造/衍生新特征(woe、iv、统计量 等); 特征筛选(离散、连续、多重共线性 等); 采样(除了随机呢?); 缺失值处理(离散、连续)... 机器学习 常用loss、正则、sgd、l-bfgs、auc公式及优缺点、数据不平衡时的调参... boot...

  工程师。曾任职于Hewlett-Packard、滴滴出行。数据学院特邀讲师。主要研究方向包括风控、推荐和半监督学习。目前专注于基于深度学习及集成模型下的用户行为模式的识别。最近抽风,出去

  字数统计:2500,预计阅读时间:12min参考目录:1 介绍项目2 EfficientNet的特色3 python撕BN层前向

  问题 图像预处理有哪些方法? 图像增强有哪些方法? 直方图均衡介绍。 膨胀和腐蚀含义?开运算和闭运算先后顺序。 传统的边缘检测算子有哪些? Canny

  最先进的面部识别软件也会发生50%的偏差。现在,英国格拉斯哥大学的两名心理学家发现了提高识别准确率的方法:用一个人的几张不同类型照片合成的图像能使软件的面部识别准确率高达100%。最新一期《科学》周刊

  工程师的进阶之路是崎岖险阻的。《线性代数》《统计学习方法》《机器学习》《模式识别》《深度学习》,以及《颈椎病康复指南》,这些书籍将长久地伴随着你的工作生涯。 *编辑配图 除了拥有全面、有条理的知识储备,我认为,想成为一名优秀的

  模型有着发自心底的热忱,对研究工作有一种匠心精神。这种匠心精神,直白来讲,可以概括为:发现问题的眼光...

  30?utm_source=csdn_bw 【导语】正值求职、跳槽季,无论你是换工作还是找实习,没有真本事都是万万不行的,可是如何高效率复习呢?之前我们给大家推荐了一份 Python

  一面 1 自我介绍 2 项目介绍 (1)项目的逻辑架构 (2)异常处理,如果视频中有马赛克的情况,怎么办。客户端在什么时候无法解密,比如协议消息缺少相应字段 (3)如何测试传输流加密的正确性 (4)国产密码SM4加密

  图片由网上提供仅供参考: import sys N = int(sys.stdin.readline().strip()) M = int(sys.stdin.readline().strip()) arr = [] for i in range(M): arr.append(sys.stdin.readline().strip()) result = [] ...

  : 头条后端:3面技术面挂 蚂蚁支付宝营销-机器学习平台开发: 技术面通过,年后被通知只有P7的hc 蚂蚁中台-机器学习平台开发: 技术面通过, 被蚂蚁HR挂掉(脉脉上好多人遇到这种情况,一个是今年大环境不好,另一个,

  一、介绍自己 介绍自己 自己的优势与劣势 介绍一个项目 二、图像处理 边缘检测(除了canny还有啥) 霍夫变换 sift surf特征,具体使用效果 hog特征是啥 稳像是什么 怎么得到灰度图像,opencv怎么实现的(???) 灰度转二值图像,阈值怎么选择(局部自适应啊) 三、C++ const static的区别 define extern的区别 内联函数 四、数据...

  工作 首先,本文不是为了增加大家的焦虑感,而是站在一名学生的角度聊聊找

  位的那些事儿(不喜请喷)。 熟悉Amusi的同学应该知道,Amusi 是一名十八线院校的研二学生。因此有幸成为秋招大军的一员。原本想着秋招完,拿到不错的Offer,再来写篇文章来总结的,...

  经验,予以参考。 数据结构 二叉树: 二叉树求叶节点的和,递归和非递归方法 判断2棵二叉树是否相同; 二叉树打印出最右侧的节点; 树(非二叉树)的合并,当前节点的值小于80的话,把值归到父节点,子节点变成父节点的子节点,并删除该节点; 判断相似二叉树,并优化到多项式时间复杂度; 求根节点到叶节点的最远距离; 链地址法中对于映射到同一...

  //2018/09/27 兵荒马乱、浩浩荡荡的秋招终于差不多要结束了。 秋招这段时间真是感慨很多,一时得意一时失意,还要平衡一不小心就来的心理落差。 先写点废话吧,毕竟最近感受挺多的,在自己的博客里也不用顾忌措辞。强行给自己灌一波鸡汤~ 1、努力永远和收获成正比,即使这个比率很小。一直觉得自己没有特别的天赋,只能一点一点努力,而这点努力还经常被“比你优秀的人比你更努力”所击溃。但这又怎样呢,不努力...

  1. 不用任何公开参考资料,估算今年新生儿出生数量 1)采用两层模型(人群画像*人群转化):新生儿出生数=各年龄层育龄女性数量*各年龄层生育比率 2)从数字到数字:如果有前几年新生儿出生数量数据,建立时间序列模型(需要考虑到二胎放开的突变事件)进行预测 3)找先兆指标,如婴儿类用品的新增活跃用户数量X表示新生儿家庭用户。Xn/新生儿n为该年新生儿家庭用户的转化率,如...

  ,相信你一定是这样的......如今,短视频成了人们的新宠,闲暇时大家总是习惯性地拿出手机“刷刷刷”。而在众多短视频应用中,坚持“记录生活,记录你”的

  干货:TensorFlow1.2~2.1各个GPU版本CUDA和cuDNN对应版本整理

  Ubuntu 20.04 LTS/RTX30XX显卡 快速配置深度学习环境(一行命令)

  DC_Calculator:博主介绍得很棒,我看完对shift综述有了个大概的理解!


本文》有 0 条评论

留下一个回复