He / MSRA initialization, from Delving Deep into Rectifiers, seems to be a recommended weight initialization when using ReLUs. Is there a built-in way to use this in TensorFlow? (similar to: How to do Xavier initialization on TensorFlow)?

<h3>TensorFlow 2.0</h3> <code>tf.keras.initializers.HeUniform()</code> or <code>tf.keras.initializers.HeNormal()</code> See docs for usage. (h/t to @mable) <h3>TensorFlow 1.0</h3> <pre class="prettyprint"><code>tf.contrib.layers.variance_scaling_initializer(dtype=tf.float32) </code></pre> This will give you He / MRSA initialization. The documentation states that the default arguments for <code>tf.contrib.layers.variance_scaling_initializer</code> correspond to He initialization and that changing the arguments can yield Xavier initialization (this is what is done in TF's internal implementation for Xavier initialization). Example usage: <pre class="prettyprint"><code>W1 = tf.get_variable('W1', shape=[784, 256], initializer=tf.contrib.layers.variance_scaling_initializer()) </code></pre> or <pre class="prettyprint"><code>initializer = tf.contrib.layers.variance_scaling_initializer() W1 = tf.Variable(initializer([784,256])) </code></pre>

How to use He initialization in TensorFlow

1 Answers

TensorFlow 2.0

tf.keras.initializers.HeUniform()

tf.keras.initializers.HeNormal()

See docs for usage. (h/t to @mable)

TensorFlow 1.0

tf.contrib.layers.variance_scaling_initializer(dtype=tf.float32)

This will give you He / MRSA initialization. The documentation states that the default arguments for tf.contrib.layers.variance_scaling_initializer correspond to He initialization and that changing the arguments can yield Xavier initialization (this is what is done in TF's internal implementation for Xavier initialization).

Example usage:

W1 = tf.get_variable('W1', shape=[784, 256],
       initializer=tf.contrib.layers.variance_scaling_initializer())

initializer = tf.contrib.layers.variance_scaling_initializer()
W1 = tf.Variable(initializer([784,256]))

193

answered Oct 27 '22 05:10

matwilso

Related questions
                            
                                pip install lxml fails on python 3.7 on windows
                            
                                what is uninitialized data in pytorch.empty function
                            
                                Pandas: seaborn countplot from several columns
                            
                                Numpy remove duplicate column values
                            
                                Curl and Python Requests (get) reporting different http status code
                            
                                Python: Create structured numpy structured array from two columns in a DataFrame
                            
                                command 'cc' failed with exit status 1 on OSX High Sierra
                            
                                Can I pip install python3.6?
                            
                                Django - ManyRelatedManager object is not iterable when returning Object
                            
                                Resampling a signal with scipy.signal.resample
                            
                                How to make Django sessionId cookie as secure
                            
                                What is the Python equivalent of CPP reinterpret_cast
                            
                                ImportError: cannot import name 'get_default_renderer'
                            
                                Django Rest Framework: HTTP 401 Unauthorized error
                            
                                PonyORM - multiple model files
                            
                                Python 2 Max Function
                            
                                How can I limit regression output between 0 to 1 in keras
                            
                                pyenv-virtualenv: `3.6.4' is not installed in pyenv
                            
                                Performance comparison Static Typing Python 3.6+ vs Cython
                            
                                Message "Exception ignored" when dealing pandas.datetime type

Donate For Us

If you love us? You can donate to us via Paypal or buy me a coffee so we can maintain and grow! Thank you!

Donate Us With

How to use He initialization in TensorFlow

Tags:

python

neural-network

tensorflow

matwilso

People also ask

1 Answers

TensorFlow 2.0

TensorFlow 1.0

matwilso

Recent Activity

Donate For Us