为什么需要设备ID

“设备ID”即用于标识设备唯一身份的ID,即 Unique Device Identifier。基于以下原因,我们经常需要处理设备ID相关功能:

  1. 统计需求。DAU,MAU,转化率,用户行为等统计。
  2. 业务需求。个性化推荐,日志收集,灰度发布,AB Test等业务侧需求。
  3. 风控需求。防刷单,反作弊等。

设备ID的特征

为了满足以上需求,一个良好的设备ID方案应当具有“唯一性”和“稳定性”两个特征。

  • 唯一性:系统中的任意两台设备,它们的设备ID应当不同。
  • 稳定性:同一台设备在重启、清空应用数据、卸载应用重装、系统升级、Android 版本升级、刷机等情况下,设备ID应当保持不变。

遗憾的是,Android 平台并没有稳定的API可以提供具有上面两点特征的ID。

可选方案及限制

关于Android设备ID,常见的方案有IMEI、MAC地址、Serial、AndroidID等,下面逐一介绍它们是什么,以及为何无法承担唯一ID的职责。

IMEI

国际设备识别码(Imternational Mobile Equipment Identity) 的缩写,即通常所说的手机串号,用于在移动电话网络中识别每一部独立的手机等移动通信设备,共15~17位数字。在拨号键盘输入*#06#即可查看。

1
2
3
4
5
// 读取IMEI的样例代码,需要 READ_PHONE_STATE 权限
fun getIMEI(): String {
val tm = getSystemService(Context.TELEPHONY_SERVICE) as TelephonyManager
return tm.deviceId
}

在早些时候,IMEI是很多应用采取的设备ID方案,因为它读取方便,且同时具备唯一性和稳定性的特征。然而自从Android 6开始,READ_PHONE_STATE被列入dangerous的保护级别,意味着我们不仅要在AndroidManifest.xml文件里申请,还应当在应用到这个权限之前动态申请。尤其在中文的安卓系统上,弹窗里的文字提示是“申请电话设备信息”,很容易让人误以为这是要获取电话号码、短信内容等敏感信息。

如果说Android 6只是提高了使用IMEI作为设备ID的门槛,Android 10则是完全堵死了这条路。在Android 10的系统里,即使申请了READ_PHONE_STATE权限,也无法获取IMEI,会抛出SecurityException异常或者返回null。

MAC地址

MAC地址(Media Access Control Address),用于标识可上网设备的唯一地址,设备有几张网卡,就会有几个MAC地址。在OSI七层模型中,MAC地址位于第二层数据链路层。看到这里你也许以为MAC地址是作为设备ID解决方案的最佳选择,实则不然,首先,MAC地址的获取方法历经多次修改,足见Google正欲收紧MAC地址权限,以后完全堵死也并非不可能。

在 (?, 6.0),[6.0, 7.0),[7.0, ?) 三种不同的Android版本下,有着不同的获取MAC地址方式,可以参考简书这篇文章 《Android 版本兼容 — Android 6.0 和 7.0后获取Mac地址》

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
// 获取MAC地址,适用于目前Android全版本,不保证以后继续适用(很大可能不再适用)
// 需要 android.permission.INTERNET 权限,为非dangerous权限,可以在AndroidManifst.xml中直接申请
fun getMAC(): String {
try {
val enumeration = getNetworkInterfaces() ?: return ""
while (enumeration.hasMoreElements()) {
val netInterface = enumeration.nextElement()
if (netInterface.name == "wlan0") {
val addr = netInterface.hardwareAddress
val result = StringBuilder()
for (b in addr) {
result.append(String.format("%02X:", b))
}

if (result.isNotEmpty()) {
result.deleteCharAt(result.length - 1)
}
return result.toString()
}
}
} catch (e: Exception) {
Log.e("tag", e.message, e)
}
return ""
}

Serial

何为Serial?Serial即“设备序列号”,是设备厂商提供的设备唯一串号,唯一性由各厂商保证。拿vivo举例,它会保证自己生产的每一台设备序列号都是不同的,但是不是与OPPO的也不一样呢?这就无法保证了。一个方案是用厂商ID_设备型号_序列号拼接起来,作为设备ID,这样可以避免不同厂商设备具有相同Serial的问题。但是,并非所有厂商都会严格按照这个规定来做。我曾经在RK3399的开发板上做过开发,试过很多张板子,它们的Serial都是0123456789,让人哭笑不得。

更糟糕的是,Android 10又堵死了获取Serial的路,会直接抛出SecurityException,除非应用是系统签名且具备android.Manifest.permission.READ_PRIVILEGED_PHONE_STATE权限。

1
2
3
4
// 读取Serial,需要 READ_PHONE_STATE 权限
// Android 10 异常
// java.lang.SecurityException: getSerial: The user 10236 does not meet the requirements to access device identifiers.
fun getSerial() = android.os.Build.getSerial()

AndroidID

AndroidID是SDK提供的获取ID方法,它不需要申明任何权限,具有64bit的取值范围,且唯一性也还不错。但是,它最大的硬伤在于无法满足稳定性:

  • 刷机、root、恢复出厂设置后都会变化
  • 对安装在8.0系统的应用来说,AndroidID取决于应用签名+设备两者的组合
  • 在8.0之前安装的应用,如果在系统升级到8.0后,卸载重装该应用,读取到的AndroidID会变化

由于以上原因,在一些要求不严格的场景中,可以采用AndroidID作为设备ID,比如记录激活数、曝光数据等。但是在严格的场景中就不能用AndroidID了,如以设备ID标识用户身份,提供相应服务的场景。

读取AndroidID的样例代码如下:

1
2
// 读取AndroidID,不需要额外申请任何权限
fun getAndroidID() = Settings.Secure.getString(contentResolver, Settings.Secure.ANDROID_ID)

可选方案总结

用一张表格总结上述方案:

方案 概述 限制
IMEI 具备唯一性和稳定性,过去的最佳选择 Android10堵死,无法获取
MAC 网卡地址,唯一且稳定 权限逐渐收紧,未来极有可能关闭
Serial 手机厂商提供的设备序列号 不保证唯一性,Android10堵死
AndroidID Android SDK 提供,不需要申请权限,唯一性较好 不具备稳定性

设计一个新方案

上述四个方案里,没有哪一个是解决设备ID问题的终极武器(银弹),只有各种方法综合运用,才是解决之道。下面提出一种设备ID方案,综合使用多个硬件ID,借助服务器生成唯一虚拟设备ID(VDID),可以最大限度地保证唯一性和稳定性。

稳定性:拜占庭容错

稳定性要求当获取不到某种ID,或者某种ID发生变化时,系统能够辨识出这个设备。借助“拜占庭容错”可以解决稳定性的问题。

拜占庭容错机制源于古老 拜占庭将军(Byzantine failures) 问题。用简单的语言解释: 如果系统中有n个故障节点,系统要想正确运行,必须至少要有2n+1个正常节点。 。但对于Android设备ID,我们采用弱化的拜占庭容错机制,即客户端每次上传4个ID(IMEI、MAC、Serial、AndroidID),服务器根据这4个ID生成一个随机的唯一ID即VDID。后续客户端再请求时,可以使用VDID,或者再次使用4个ID,由服务器拿这4个ID在数据库中进行查找VDID,若找到则返回,若未找到,再使用4个ID中的3个进行查找,3个不行则用2个,以此类推。

获取VDID的时序图

vdid_sequence
vdid_sequence

唯一性:VDID的生成方式与取值范围

要实现VDID的唯一性,有两种方案可以考虑:

方案一:自增主键ID

自增、分步自增、分段构造、Redis分布式ID等方法,可以保证唯一性。但是在传输此类ID时,应当进行hash操作,且保证hash后的ID不可碰撞。

自增ID的优点是可作为索引,检索速度快;缺点是生成规则存在被破解的风险。

方案二:随机生成ID

这是另一种生成唯一ID的方法,当位数足够多时,可以认为碰撞概率趋近于0。首先看一下这张表,它描述了随机数位数与发生碰撞的概率。

random_collision
random_collision

假设我们应用的活跃用户数为20,000,000,即两千万。可以看到至少要有128Bits,才能在2*10^7(两千万)的数量级有极小的碰撞概率,符合我们的业务需求。

随机ID的优点是具有隐蔽性,缺点是检索效率一般。

小结

本文是笔者阅读郭霖公众号推文《漫谈设备唯一ID的那些秘密》后的总结归纳,此处向原作者@呼啸长风致谢。然而作者原文中有一处纰漏,设备序列号(SERIAL)在Android 10上基本是无法获取的,这也会影响原作者提出的解决方案。笔者已经在Github上对此提了issue

出于对用户隐私的保护,Google一直试图收紧的设备ID的获取权限。而由于“账户”的概念在国内市场并不普遍,再加上各大OEM碎片化严重,国内的各种业务不得不依赖于设备ID进行展开。这也是开发者近年来不得不面对的问题,希望未来国内的Android生态可以更加统一,也希望Google也对此类需求提供更好的权限方案,能让开发者可以不必为此头痛。