Cheap and reliable Node.js hosting starts at $3/month, and $1/month static HTML hosting

Created with love in Canada, visit hostnodejs.com today

Feel like to post an Ad? Learn Details

All Projects → laobadao → Deep Learning Interview

laobadao / Deep Learning Interview

Licence: apache-2.0

深度学习面试汇总，基本知识点的查漏补缺

Labels

jupyter-notebook

Projects that are alternatives of or similar to Deep Learning Interview

Ml4music Workshop

Machine Learning for Music and Sound Synthesis workshop

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Ipywidgets Static

[obsolete] Static Widgets for IPython Notebooks

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Harry potter nlp

Harry Potter and the Allocation of Dirichlet

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

Pixel2style2pixel

Official Implementation for "Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation"

Stars: ✭ 1,395 (+1216.04%)

Mutual labels: jupyter-notebook

Openomni

Documentation and library for decoding omnipod communications.

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Time Series Forecasting With Python

A use-case focused tutorial for time series forecasting with python

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Tf objectdetection api

Tutorial on how to create your own object detection dataset and train using TensorFlow's API

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Research Methods For Data Science With Python

Research Methods for Data Science with Python

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

Intro machine learning

Introduction to Machine Learning, a series of IPython Notebook and accompanying slideshow and video

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Mcmc pydata london 2019

PyData London 2019 Tutorial on Markov chain Monte Carlo with PyMC3

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Anomaly Detection

Anomaly detection algorithm implementation in Python

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Intro To Deep Learning For Nlp

The repository contains code walkthroughs which introduces Deep Learning in the field of Natural Language Processing.

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Cross Lingual Voice Cloning

Tacotron 2 - PyTorch implementation with faster-than-realtime inference modified to enable cross lingual voice cloning.

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

How To Generate Art Demo

This is the code for "How to Generate Art - Intro to Deep Learning #8' by Siraj Raval on YouTube

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Self Driving Car

A End to End CNN Model which predicts the steering wheel angle based on the video/image

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

Deepai

Detection of Accounting Anomalies using Deep Autoencoder Neural Networks - A lab we prepared for NVIDIA's GPU Technology Conference 2018 that will walk you through the detection of accounting anomalies using deep autoencoder neural networks. The majority of the lab content is based on Jupyter Notebook, Python and PyTorch.

Stars: ✭ 104 (-1.89%)

Mutual labels: jupyter-notebook

Makeittalk

Stars: ✭ 105 (-0.94%)

Mutual labels: jupyter-notebook

Stream

STREAM: Single-cell Trajectories Reconstruction, Exploration And Mapping of single-cell data

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

Tensorflow 2.0 Quick Start Guide

Tensorflow 2.0 Quick Start Guide, published by Packt

Stars: ✭ 106 (+0%)

Mutual labels: jupyter-notebook

Tianchi Antaicup International E Commerce Artificial Intelligence Challenge

1st place solution for the AntaiCup-International-E-commerce-Artificial-Intelligence-Challenge

Stars: ✭ 104 (-1.89%)

Mutual labels: jupyter-notebook

View All Similar Projects ➔

Deep-Learning-Interview

深度学习面试汇总，基本知识点的查漏补缺

参考文章：

https://github.com/elviswf/DeepLearningBookQA_cn

那些深度学习《面试》你可能需要知道的（中文页标版）本文原作者Jin Lee，本文原载于知乎专栏。问题集： https://zhuanlan.zhihu.com/p/29936999

回答及对应英文页标：https://zhuanlan.zhihu.com/p/29965072

elviswf 对上述问题找到中文版对应页码。github 地址： https://github.com/elviswf/DeepLearningBookQA_cn

本人以自身学习，加强基础知识为目的，查漏补缺。将对应页面知识，进行复习，学习，总结提炼。---ZJ

实体书，中文版 2017 年 8 月第一版，2017 年 12 月第 7 次印刷

1. 列举常见的一些范数及其应用场景，如 L0，L1，L2，L∞，Frobenius 范数

答：p24-p25 ；还有 p141-p156 有 regularization 的应用

2. 简单介绍一下贝叶斯概率与频率派概率，以及在统计中对于真实参数的假设。

答：p35

3. 概率密度的万能近似器

答：p43：3.10 上面那一段

4. 简单介绍一下 sigmoid，relu，softplus，tanh，RBF 及其应用场景

答：sigmoid 和 softplus 在 p43 页；全部的在 p119-p122

5.Jacobian，Hessian 矩阵及其在深度学习中的重要性

答：p56-p62

6.KL 散度在信息论中度量的是那个直观量

答：p47-49

7. 数值计算中的计算上溢与下溢问题，如 softmax 中的处理方式

答：p52-p53

8. 与矩阵的特征值相关联的条件数 (病态条件) 指什么，与梯度爆炸与梯度弥散的关系

答：p53;

9. 在基于梯度的优化问题中，如何判断一个梯度为 0 的零界点为局部极大值／全局极小值还是鞍点，Hessian 矩阵的条件数与梯度下降法的关系

答：p56-p62

10.KTT 方法与约束优化问题，活跃约束的定义

答：p60-p61

11. 模型容量，表示容量，有效容量，最优容量概念

答：p70;p71;p72

12. 正则化中的权重衰减与加入先验知识在某些条件下的等价性

答：p74 75

13. 高斯分布的广泛应用的缘由

答：p40

14. 最大似然估计中最小化 KL 散度与最小化分布之间的交叉熵的关系

答：p83,84,85

15. 在线性回归问题，具有高斯先验权重的 MAP 贝叶斯推断与权重衰减的关系，与正则化的关系

答: p87

16. 稀疏表示，低维表示，独立表示

答：p92

17. 列举一些无法基于地图 (梯度？) 的优化来最小化的代价函数及其具有的特点

答：p97 维度灾难

18. 在深度神经网络中，引入了隐藏层，放弃了训练问题的凸性，其意义何在

答：p119-122

19. 函数在某个区间的饱和与平滑性对基于梯度的学习的影响

答：p98

20. 梯度爆炸的一些解决办法？？？

答：p185 是在这页吗？后面再细看

21.MLP 的万能近似性质

答：p123

22. 在前馈网络中，深度与宽度的关系及表示能力的差异？？？

答：p125

23. 为什么交叉熵损失可以提高具有 sigmoid 和 softmax 输出的模型的性能，而使用均方误差损失则会存在很多问题。分段线性隐藏层代替 sigmoid 的利弊

答：p140

24. 表示学习的发展的初衷？并介绍其典型例子: 自编码器

答：p3

25. 在做正则化过程中，为什么只对权重做正则惩罚，而不对偏置做权重惩罚

答：p142

26. 在深度学习神经网络中，所有的层中考虑使用相同的权重衰减的利弊

答：p142

27. 正则化过程中，权重衰减与 Hessian 矩阵中特征值的一些关系，以及与梯度弥散，梯度爆炸的关系

答：p142-144

28.L1／L2 正则化与高斯先验／对数先验的 MAP 贝叶斯推断的关系

答：p145，146

29. 什么是欠约束，为什么大多数的正则化可以使欠约束下的欠定问题在迭代过程中收敛

答：p147 页底 Chapter 7.3

30. 为什么考虑在模型训练时对输入 (隐藏单元／权重) 添加方差较小的噪声，与正则化的关系

答：p149-p150 Chapter 7.5-7.6

31. 共享参数的概念及在深度学习中的广泛影响

答：多任务学习 p151;p156 Chapter 7.7; 7.9

32. Dropout 与 Bagging 集成方法的关系，以及 Dropout 带来的意义与其强大的原因

答：p159-p165 Chapter 7.12

33. 批量梯度下降法更新过程中，批量的大小与各种更新的稳定性关系

答：p170 Chapter 8.1.3

34. 如何避免深度学习中的病态，鞍点，梯度爆炸，梯度弥散

答：p173-p178 Chapter 8.2.1

35.SGD 以及学习率的选择方法，带动量的 SGD 对于 Hessian 矩阵病态条件及随机梯度方差的影响

答：p180；p181-p184 Chapter 8.3;

36. 初始化权重过程中，权重大小在各种网络结构中的影响，以及一些初始化的方法；偏置的初始化

答：初始化权重：p184； Chapter 8.4 偏置初始化：p186页底 Chapter 8.4

37. 自适应学习率算法: AdaGrad，RMSProp，Adam 等算法的做法

答：AdaGrad:p187;
RMSProp:p188; Adam:p189 Chapter 8.5.1-3

38. 二阶近似方法: 牛顿法，共轭梯度，BFGS 等的做法

答：牛顿法：p190 Chapter 8.6.1; 共轭梯度: p191-p193; Chapter 8.6.2 BFGS:p193-p194 Chapter 8.6.3

39.Hessian 的标准化对于高阶优化算法的意义

答：p195 Chapter 8.7.1

40. 卷积网络中的平移等变性的原因，常见的一些卷积形式

答：平移等变性：p205页底； Chapter 9.3 常见的一些卷积形式：p211-p218 Chapter 9.5

41.pooling 的做法的意义

答：p207; p210 Chapter 9.3-4

42. 循环神经网络常见的一些依赖循环关系，常见的一些输入输出，以及对应的应用场景

答：p230-p238 Chapter 10.2

43. seq2seq，gru，lstm 等相关的原理

答：seq2seq:p240-p241; Chapter 10.4 gru:p250; Chapter 10.10.2 lstm:p248 Chapter 10.10.1

44. 采样在深度学习中的意义

答：p286 第一段 Chapter 12.4.3

45. 自编码器与线性因子模型，PCA，ICA 等的关系

答：线性因子模型可以扩展到自编码器和深度概率模型: p304-p305; Chapter 13.5
PCA:p298; Chapter 13.1 ICA:p298 Chapter 13.2

46. 自编码器在深度学习中的意义，以及一些常见的变形与应用

答：意义: p306 Chapter 14.1 常见变形: p306-p313 Chapter 14.5 应用: p319 Chapter 14.9

47. 受限玻尔兹曼机广泛应用的原因

答：p400: 想特别了解的人注意这句话： See Mohamed et al. (2012b) for an analysis of reasons for the success of these models. Chapter 20.2

48. 稳定分布与马尔可夫链

答：p362 Chapter 17.3

49.Gibbs 采样的原理

答：p365 Chapter 17.4

50. 配分函数通常难以计算的解决方案

答：p368 Chapter 17.5.2 “遇到难以处理的无向图模型中的配分函数时，蒙特卡洛方法仍是最主要工具”

51. 几种参数估计的联系与区别: MLE／MAP／贝叶斯

答：P82/85/87 Chapter 5.5

52. 半监督的思想以及在深度学习中的应用

答：p329-p332 Chapter 15.3

53. 举例 CNN 中的 channel 在不同数据源中的含义

答：p219-220 Chapter 9.7

54. 深度学习在 NLP，语音，图像等领域的应用及常用的一些模型

答：p272-p293 Chapter 12.1-5

55.word2vec 与 glove 的比较

答：How is GloVe different from word2vec?；

GloVe 以及 Word2vec 能称为 deep learning 么？这俩模型的层次其实很浅的；

http://t.cn/RvYslDf

这个问题没找到答案，我去找了 quora 和知乎上的相关问题以及 quora 一个回答提及的论文。（若有人在书中找到，请批评指正）

56. 注意力机制在深度学习的某些场景中为何会被大量使用，其几种不同的情形

答：p288 Chapter 12.4.5.1

57.wide&deep 模型中的 wide 和 deep 介绍

答：https://arxiv.org/pdf/1606.07792.pdf#### 此问题答案未在书中找到，为此我去找了原论文，论文图 1 有详细的介绍。（若有人在书中找到，请批评指正）

58. 核回归与 RBF 网络的关系

答：p89 Chapter 5.7.2

59.LSTM 结构推导，为什么比 RNN 好？

答：p248 Chapter 10.10

60. 过拟合在深度学习中的常见的一些解决方案或结构设计

答：p143-159； Chapter 7.1-12 包括：Parameter Norm Penalties(参数范数惩罚); Dataset Augmentation (数据集增强); Early Stopping(提前终止); Parameter Tying and Parameter Sharing (参数绑定与参数共享); Bagging and Other Ensemble Methods(Bagging 和其他集成方法)；Dropout. 另外还有 Batch Normalization。

61. 怎么理解贝叶斯模型的有效参数数据会根据数据集的规模自动调整

答：关于非参数模型：p72 ； Chapter 5.2 非参数模型不依赖于特定的概率模型，它的参数是无穷维的，数据集的规模的大小影响着模型使用更多或者更少的参数来对其进行建模。(并未在书中找到准确的答案，若有更好的回答，请联系我改正)

本答案是根据问题在_Deep Learning_上找到的答案；有些答案只是自己读书后在书上做的笔记的具体页面，毕竟原 po（http://t.cn/RObdPGk）说还有另外一本书，所以该答案可能不是特别准确也不完善，答案也是给大家做个参考，若发现答案有问题，请联系我并指正，大家共同进步，谢谢！

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].

Stars: ✭ 106

Visit Git Page 🔗Visit User Page 🔗Visit Issues Page (0) 🔗

Cheap and reliable Node.js hosting starts at $3/month, and $1/month static HTML hosting

laobadao / Deep Learning Interview

Labels

Projects that are alternatives of or similar to Deep Learning Interview

Deep-Learning-Interview

1. 列举常见的一些范数及其应用场景，如 L0，L1，L2，L∞，Frobenius 范数

2. 简单介绍一下贝叶斯概率与频率派概率，以及在统计中对于真实参数的假设。

3. 概率密度的万能近似器

4. 简单介绍一下 sigmoid，relu，softplus，tanh，RBF 及其应用场景

5.Jacobian，Hessian 矩阵及其在深度学习中的重要性

6.KL 散度在信息论中度量的是那个直观量

7. 数值计算中的计算上溢与下溢问题，如 softmax 中的处理方式

8. 与矩阵的特征值相关联的条件数 (病态条件) 指什么，与梯度爆炸与梯度弥散的关系

9. 在基于梯度的优化问题中，如何判断一个梯度为 0 的零界点为局部极大值／全局极小值还是鞍点，Hessian 矩阵的条件数与梯度下降法的关系

10.KTT 方法与约束优化问题，活跃约束的定义

11. 模型容量，表示容量，有效容量，最优容量概念

12. 正则化中的权重衰减与加入先验知识在某些条件下的等价性

13. 高斯分布的广泛应用的缘由

14. 最大似然估计中最小化 KL 散度与最小化分布之间的交叉熵的关系

15. 在线性回归问题，具有高斯先验权重的 MAP 贝叶斯推断与权重衰减的关系，与正则化的关系

16. 稀疏表示，低维表示，独立表示

17. 列举一些无法基于地图 (梯度？) 的优化来最小化的代价函数及其具有的特点

18. 在深度神经网络中，引入了隐藏层，放弃了训练问题的凸性，其意义何在

19. 函数在某个区间的饱和与平滑性对基于梯度的学习的影响

20. 梯度爆炸的一些解决办法 ？？？

21.MLP 的万能近似性质

22. 在前馈网络中，深度与宽度的关系及表示能力的差异 ？？？

23. 为什么交叉熵损失可以提高具有 sigmoid 和 softmax 输出的模型的性能，而使用均方误差损失则会存在很多问题。分段线性隐藏层代替 sigmoid 的利弊

24. 表示学习的发展的初衷？并介绍其典型例子: 自编码器

25. 在做正则化过程中，为什么只对权重做正则惩罚，而不对偏置做权重惩罚

26. 在深度学习神经网络中，所有的层中考虑使用相同的权重衰减的利弊

27. 正则化过程中，权重衰减与 Hessian 矩阵中特征值的一些关系，以及与梯度弥散，梯度爆炸的关系

28.L1／L2 正则化与高斯先验／对数先验的 MAP 贝叶斯推断的关系

29. 什么是欠约束，为什么大多数的正则化可以使欠约束下的欠定问题在迭代过程中收敛

30. 为什么考虑在模型训练时对输入 (隐藏单元／权重) 添加方差较小的噪声，与正则化的关系

31. 共享参数的概念及在深度学习中的广泛影响

32. Dropout 与 Bagging 集成方法的关系，以及 Dropout 带来的意义与其强大的原因

33. 批量梯度下降法更新过程中，批量的大小与各种更新的稳定性关系

34. 如何避免深度学习中的病态，鞍点，梯度爆炸，梯度弥散

35.SGD 以及学习率的选择方法，带动量的 SGD 对于 Hessian 矩阵病态条件及随机梯度方差的影响

36. 初始化权重过程中，权重大小在各种网络结构中的影响，以及一些初始化的方法；偏置的初始化

37. 自适应学习率算法: AdaGrad，RMSProp，Adam 等算法的做法

38. 二阶近似方法: 牛顿法，共轭梯度，BFGS 等的做法

39.Hessian 的标准化对于高阶优化算法的意义

40. 卷积网络中的平移等变性的原因，常见的一些卷积形式

41.pooling 的做法的意义

42. 循环神经网络常见的一些依赖循环关系，常见的一些输入输出，以及对应的应用场景

43. seq2seq，gru，lstm 等相关的原理

44. 采样在深度学习中的意义

45. 自编码器与线性因子模型，PCA，ICA 等的关系

46. 自编码器在深度学习中的意义，以及一些常见的变形与应用

47. 受限玻尔兹曼机广泛应用的原因

48. 稳定分布与马尔可夫链

49.Gibbs 采样的原理

50. 配分函数通常难以计算的解决方案

51. 几种参数估计的联系与区别: MLE／MAP／贝叶斯

52. 半监督的思想以及在深度学习中的应用

53. 举例 CNN 中的 channel 在不同数据源中的含义

54. 深度学习在 NLP，语音，图像等领域的应用及常用的一些模型

55.word2vec 与 glove 的比较

56. 注意力机制在深度学习的某些场景中为何会被大量使用，其几种不同的情形

57.wide&deep 模型中的 wide 和 deep 介绍

58. 核回归与 RBF 网络的关系

59.LSTM 结构推导，为什么比 RNN 好？

60. 过拟合在深度学习中的常见的一些解决方案或结构设计

61. 怎么理解贝叶斯模型的有效参数数据会根据数据集的规模自动调整

20. 梯度爆炸的一些解决办法？？？

22. 在前馈网络中，深度与宽度的关系及表示能力的差异？？？