当前位置:   article > 正文

TensorFlow创建变量_如何在tensorflow中创建和使用变量?

如何在tensorflow中创建和使用变量?

一、使用tf.Variable函数创建变量

tf.Variable(initial_value=None,trainable=True,collections=None,validate_shape=True,caching_device=None,name=None,variable_def=None,dtype=None,expected_shape=None,import_scope=None)

函数功能:创建一个新的变量,变量的值是initial_value,创建的变量会被添加到[GraphKeys.GLOBAL_VARIABLES]默认的计算图列表中,如果trainable被设置为True,这个变量还会被添加到GraphKeys.TRAINABLE_VARIABLES计算图的集合中。

参数:

initial_value:默认值是None,张量或者是一个python对象可以转成张量,这个initial_value是初始化变量的值。它必须有一个特殊的shape,除非validate_shape设置为False。

trainable:默认的是True,变量还会被添加到GraphKeys.TRAINABLE_VARIABLES计算图集合中。

collections:变量会被添加到这个集合中,默认的集合是[GraphKeys.GLOBAL_VARIABLES]。

validate_shape:如果是False,允许这个变量被初始化一个不知道shape。默认的是True,这个initial_value的shape必须是知道的。

name:变量的名字。

dypte:变量的类型,小数的默认是float32,整数默认是int32。

  1. a = tf.Variable(initial_value=[1,2,3],name="a")
  2. init = tf.initialize_all_variables()
  3. sess = tf.Session()
  4. sess.run(init)
  5. print(a.eval(session=sess))
  6. #[1 2 3]
  7. print(a.dtype)
  8. #<dtype: 'int32_ref'>
二、使用tf.get_variable函数创建变量

tf.get_variable(name,shape=None,dtype=None,initializer=None,regularizer=None,trainable=True,collections=None,
caching_device=None,partitioner=None,validate_shape=True,use_resource=None,custom_getter=None)

函数功能:根据变量的名称来获取变量或者创建变量。

参数:

name:变量的名称(必选)。

shape:变量的shape。

dtype:变量的数据类型。

initializer:变量的初始化值。

1、根据变量的名称创建变量

  1. b = tf.get_variable(name="b", initializer=[1., 2., 3.])
  2. init = tf.initialize_all_variables()
  3. sess = tf.Session()
  4. sess.run(init)
  5. print(b.eval(session=sess))
  6. #[ 1. 2. 3.]
  7. print(b.dtype)
  8. #<dtype: 'float32_ref'>

使用tf.get_variable创建变量的时候,如果不指定name,会报TypeError: get_variable() missing 1 required positional argument: 'name'

2、根据变量的名称获取变量
  1. with tf.variable_scope("f"):
  2. #初始化一个变量名称为c的变量
  3. c = tf.get_variable(name="c",shape=[3],initializer=tf.constant_initializer([1,2,3]))
  4. with tf.variable_scope("f",reuse=True):
  5. d = tf.get_variable(name="c",shape=[3])
  6. sess = tf.Session()
  7. init = tf.initialize_all_variables()
  8. sess.run(init)
  9. print(d.eval(session=sess))
  10. #[ 1. 2. 3.]
  11. print(c.eval(session=sess))
  12. #[ 1. 2. 3.]
  13. print(d == c)
  14. #True
在使用tf.get_variable()根据变量的名称来获取已经生成变量的时候,需要通过tf.variable_scope函数来生成一个上下文管理器,并明确指定在这个上下文管理器中。获取变量值的时候,需要将上下文管理器中的reuse设置为True,才能直接获取已经声明的变量,如果不设置reuse会报错。需要注意的是,如果变量名在上下文管理器中已经存在,在获取的时候,如果不将reuse设置为True则会报错。同理,如果上下文管理器中不存在变量名,在使用reuse=True获取变量值的时候,也会报错。
三、tf.variable_scope的嵌套

  1. with tf.variable_scope("a"):#默认是False
  2. #查看上下文管理器中的reuse的值
  3. print(tf.get_variable_scope().reuse) #False
  4. with tf.variable_scope("b",reuse=True):
  5. print(tf.get_variable_scope().reuse) #True
  6. #如果reuse是默认的则保持和上一层的reuse值一样
  7. with tf.variable_scope("c"):
  8. print(tf.get_variable_scope().reuse) #True
  9. print(tf.get_variable_scope().reuse) #False
四、上下文管理器与变量名

  1. #没有上下文管理器
  2. a = tf.get_variable(name="a",shape=[2],initializer=tf.constant_initializer([1,2]))
  3. print(a.name) #a:0,a就是变量名
  4. #声明上下文管理器
  5. with tf.variable_scope("f"):
  6. b = tf.get_variable(name="b",shape=[2],initializer=tf.constant_initializer([1,2]))
  7. print(b.name) #f/b:0,f代表的是上下文管理器的名称,b代表的是变量的名称
  8. #嵌套上下文管理器
  9. with tf.variable_scope("g"):
  10. c = tf.get_variable(name="c",shape=[2],initializer=tf.constant_initializer([1,2]))
  11. print(c.name)#f/g/c:0
通过上下文管理器和变量名来获取变量

  1. #通过带上下文管理器名称和变量名来获取变量
  2. with tf.variable_scope("",reuse=True):
  3. d = tf.get_variable(name="f/b")
  4. print(d == b) #True
  5. e = tf.get_variable(name="f/g/c")
  6. print(e == c) #True






声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/95971
推荐阅读
相关标签
  

闽ICP备14008679号