当前位置:   article > 正文

关于Jetpack DataStore(Preferences)的八点疑问_datastore-preferences

datastore-preferences

前言

DataStore是Android上一种轻量级存储方案,依据官方教程很容易就写出简易的Demo。
本篇主要是分析关于DataStore(Preferences)使用过程中的一些问题,通过问题寻找本质,反过来能更好地指导我们合理使用DataStore。
本篇内容目录:
image.png

1. DataStore如何存取数据?

DataStore有两种存储类型:Preferences(与SharedPreferences对标) 和 Proto。

为方便行文,以下所说的DataStore指的是Preferences类型。

引入依赖

在Module级别的build.gradle里引入:

implementation("androidx.datastore:datastore-preferences:1.0.0")
  • 1

使用DataStore存取数据

存数据

  1. 先声明DataStore对象:
val Context.dataStore: DataStore<Preferences> by preferencesDataStore(name = "test")
  • 1

DataStore是key-value 结构,因此在存取数据之前先定义好key的名字以及value的类型。

  1. 声明key的结构
    val myNameKey = stringPreferencesKey("name")
    val myAgeKey = intPreferencesKey("age")
  • 1
  • 2

想要在DataStore里存储姓名和年龄,其中姓名是String类型,年龄是Int类型。

  1. 存储value
    suspend fun saveData() {
        context.dataStore.edit {
            //给不同的key赋值
            it[myNameKey] = "fish"
            it[myAgeKey] = 18
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

取数据

    suspend fun queryData() {
        context.dataStore.data.collect {
            it.asMap().forEach {
                println("${it.key.name}, ${it.value}")
            }
        }
    }
//打印结果:
I/System.out: name, fish
I/System.out: age, 18
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

可以看出存取过程和SharedPreferences很相似,只是key的构造有些差异。

2. DataStore能存放哪些类型数据?

上面在构造DataStore的Key时,我们使用了两个函数:
stringPreferencesKey与intPreferencesKey,其中前缀指明了存储的value是什么类型。
实际上还有其它类型的value:
image.png

可以看出有7种类型:

Boolean、Double、Float、Int、Long、String、Set

3. DataStore存取是否耗时?

在存储数据时,我们都依赖于:

dataStore.data
  • 1

而它是Flow类型:
image.png

而Flow必须要在协程里使用,因此我们使用了挂起函数(suspend)修饰存取函数。
同时我们也知道,挂起函数并不耗时。
当在主线程里分别调用DataStore的存取函数,并不会阻塞主线程。

image.png

值得注意的是:

  1. 存取数据的闭包的执行是在当前协程(调用saveData/queryData的协程)里执行的
  2. 假若当前是在主线程发起的存取动作,那么闭包将在主线程执行

总的来说:借助于协程的特性,DataFlow存取数据并不耗时。

4. DataStore Flow是如何设计的?

DataStore Flow是冷流还是热流?

先看DataStore的实现,主要依靠:SingleProcessDataStore。
在里面找到dataStore.data的定义:

    //定义热流
    private val downstreamFlow = MutableStateFlow(UnInitialized as State<T>)
    override val data: Flow<T> = flow {

        val currentDownStreamFlowState = downstreamFlow.value

        if (currentDownStreamFlowState !is Data) {
            actor.offer(SingleProcessDataStore.Message.Read(currentDownStreamFlowState))
        }

        emitAll(
            //监听热流变化
            downstreamFlow.dropWhile {
                //满足条件则丢弃数据
                if (currentDownStreamFlowState is Data<T> ||
                    currentDownStreamFlowState is Final<T>
                ) {
                    //不满足则继续流向map
                    false
                } else {
                    //判断是否满足
                    it === currentDownStreamFlowState
                }
            }.map {
                when (it) {
                    //根据类型,返回不同的值
                    is ReadException<T> -> throw it.readException
                    is Final<T> -> throw it.finalException
                    //正常的返回值
                    is Data<T> -> it.value
                    is UnInitialized -> error(
                        "This is a bug in DataStore. Please file a bug at: " +
                                "https://issuetracker.google.com/issues/new?" +
                                "component=907884&template=1466542"
                    )
                }
            }
        )
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39

image.png

可以看出:

  1. dataStore.data 是Flow,它是冷流
  2. dataStore.data 里依靠downstreamFlow(热流)持续监听数据的变化
  3. 因此dataStore.data 可以持续监听数据的变化,当DataStore里数据发生变化时将会回调闭包

DataStore Flow与其它Flow的差异

先看普通的flow:

    suspend fun queryData2() {
        val flow = flow { 
            emit("hello")
        }
       
        flow.collect {
            println(it)
        }
       
        println("normal flow end")
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

大家猜测一下:"normal flow end"会打印吗?

再看DataStore的Flow:

    suspend fun queryData() {
        context.dataStore.data.collect {
            it.asMap().forEach {
                println("${it.key.name}, ${it.value}")
            }
        }

        println("dataStore flow end")
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

再猜一下:"dataStore flow end"会打印吗?
答案是:

"normal flow end"会打印,而"dataStore flow end"永远没有机会执行

原因是DataStore Flow里依赖了热流监听数据,而热流的collect是不会退出的。
其实这也很容易想到:若是DataStore Flow的collect退出了,它就无法监听数据变化了。

5. DataStore 刷新范围?

存取影响范围

我们已经知道DataStore Flow可以监听数据的变化,假设我们一个文件里存放了很多对Key–Value,但是我们只关心其中一个或是某几个Key–Value的变化,比如现在新增一个key="score"字段:

    val myScoreKey = floatPreferencesKey("score")
    suspend fun queryDataV2() {
        context.dataStore.data.map {
            //只关心分数的变化    
            it[myScoreKey]
        }..collect {
            println("$it")
        }
    }
    suspend fun saveData2() {
        context.dataStore.edit {
            //只修改分数
            it[myScoreKey] = 99f
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

虽然文件了存放了三个字段:name、age、score,但是我们只更新了score字段,并且也仅仅监听score字段的变化。

那么问题来了:单个设置/监听某个字段会提升效率吗?
答案是:不会,因为DataStore的更新是基于单个文件的全量更新,也就是说虽然只是更改了score字段的值,写入文件的时候name/age字段值也会写入

我们换个写法来进行测试:

    suspend fun saveData2() {
        context.dataStore.edit {
            //只修改分数
            it[myNameKey] = "fish is perfect"
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

现在只是更改name字段,最后发现只监听了score变化的闭包也调用了。

小结:

DataStore更新和监听都是针对单个文件的全部字段

存相同的数值

还是以保存name为例:

    suspend fun saveData2() {
        context.dataStore.edit {
            //只修改分数
            it[myNameKey] = "fish is perfect"
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

当调用这函数两次。

问题:第二次调用的时候,还有会写文件的动作吗?
答案:不会,因为每次更新数据之前都会比对和上一次的数据是否一致,若是一致则不会再写入文件,当然也不会产生数据变化的通知

6. DataStore是线程安全的吗?

先看Demo:

    suspend fun saveData2() {
        context.dataStore.edit {
            //只修改分数
            it[myNameKey] = "fish is perfect3"
        }
    }

    GlobalScope.launch(Dispatchers.IO) {
        myDataStore.saveData2()
    }

    GlobalScope.launch(Dispatchers.Main) {
        myDataStore.saveData2()
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

同时在子线程和主线程去更新DataStore的内容,这样合理吗?会有线程安全的问题产生吗?
答案:合理的、可行的,因为DataStore的读写是线程安全的

image.png

  1. 不管是读还是写,每次调用当做一次任务,若当前没有协程执行任务,则开启新协程执行任务,新协程跑在IO线程里
  2. 若是有任务在执行,则仅仅只是将任务加入到队列里,调用者返回;当上个任务执行完毕再执行该任务
  3. 因此单个DataStore读写是线程安全的。

此处的策略和线程池的实现类似,有需要的可以查看过往关于线程池设计的文章。

7. 能否创建多个DataStore实例?

我们一般会将都DataStore的操作封装起来:

class MyDataStore(val context: Context) {
    val Context.dataStore: DataStore<Preferences> by preferencesDataStore(name = "test")

    suspend fun saveData2() {
        context.dataStore.edit {
            //只修改分数
            it[myNameKey] = "fish is perfect3"
        }
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

而在Activity里的onCreate()方法调用如下:

        lifecycleScope.launch {
            MyDataStore(this@DataStoreActivity).saveData2()
        }
  • 1
  • 2
  • 3

问题:这么写会有什么问题呢?

你可能会说,我试了没啥问题啊?进入Activity后成功写入DataStore。
那退出Activity再进入Activity试一次呢?

兴许你已经遇到Crash了:
image.png

提示不能有多个DataStore实例去操作同一个文件。

你可能又有疑问了:第一次进入Activity用的是一个DataStore实例,第二次进入Activity是另一个新的实例,第一个实例已经销毁了呀?为啥还会提示?

因为我们并不能完全确保同一时间只有一个DataStore实例在操作,若是存在不同的实例访问同一个文件,那么将会产生不可预期的脏数据。因此DataStore设计时就严格限制只能有一个实例访问同一个文件。

image.png

那么如何避免此种问题呢?很简单,只需要确保我们创建同一个文件只关联一个DataStore实例即可。

class MyDataStore(val context: Context) {
    companion object {
        val Context.dataStore: DataStore<Preferences> by preferencesDataStore(MyDataStore.javaClass.name)
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5

通过静态变量确保只有一个实例。

8. DataStore 如何获取同步数据?

DataStore的核心优势在于:

使用协程挂起函数存取数据,不阻塞UI,不像SharedPreferences可能会引发ANR。

DataStore只对外暴露了Flow,调用者需要通过Flow存取数据,也就是要求调用者要拥有协程环境。
然而我们可能面临的现实环境是:

  1. 调用者没有协程环境(针对老的代码)
  2. 调用者需要同步访问DataStore数据

第1点就不说了,有些老代码是Java代码,无法使用协程/接入协程代价较大。
第2点的场景:基础数据如登录与否存储在DataStore,而其它调用方仅仅只需要1个方法判断是否已经登录。

针对第2点需要同步方法有两种思路:

  1. 提供一个同步方法,用于获取外界关注的状态,而内部监听Flow的变化,有变化就同步到状态里, 如此一来,对于协程和Flow的使用控制在内部,外部仅仅只需要获取内存状态即可
  2. 提供一个同步方法,直接获取数据

我们来看看第二种思路的实现:

    val myNameKey = stringPreferencesKey("name")
    fun getName():String? {
        return runBlocking {
            context.dataStore.data.map {
                it[myNameKey]
            }.first() as? String
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

可以看出,我们提供的getName()并不是挂起函数,外界调用会一直等到数据的返回。

此处你可能会有担忧:getName()函数阻塞了,如果主线程调用不会耗时吗?

没错,你的担忧是合理的,假若该DataStore是第一次读取,那么getName()将阻塞等待DataStore将文件加载到内存,最后才会返回。
而只要读取了一次数据,那么后续将无需再次进行I/O读取,都是内存操作,无需担忧耗时问题。

对于第一次读取耗时问题,我们可以进行预加载,比如在某个时机提前加载数据。

9. DataStore 全流程

image.png

本文基于:datastore-preferences:1.0.0
下篇将分析DataStore Proto,敬请关注。

您若喜欢,请点赞、关注、收藏,您的鼓励是我前进的动力

持续更新中,和我一起步步为营系统、深入学习Android/Kotlin

1、Android各种Context的前世今生
2、Android DecorView 必知必会
3、Window/WindowManager 不可不知之事
4、View Measure/Layout/Draw 真明白了
5、Android事件分发全套服务
6、Android invalidate/postInvalidate/requestLayout 彻底厘清
7、Android Window 如何确定大小/onMeasure()多次执行原因
8、Android事件驱动Handler-Message-Looper解析
9、Android 键盘一招搞定
10、Android 各种坐标彻底明了
11、Android Activity/Window/View 的background
12、Android Activity创建到View的显示过
13、Android IPC 系列
14、Android 存储系列
15、Java 并发系列不再疑惑
16、Java 线程池系列
17、Android Jetpack 前置基础系列
18、Android Jetpack 易学易懂系列
19、Kotlin 轻松入门系列
20、Kotlin 协程系列全面解读

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/752848
推荐阅读
相关标签
  

闽ICP备14008679号