白乐天

道阻且长,行则将至。

dex文件结构

介绍

dex(Dalvik Executable)是Android平台源代码文件(java,kotlin)经过编译、重构、重排、压缩、混淆后的字节码文件,是对传统的class 文件再处理。和class 文件比,dex的体积更小,dex可以将多个class文件特征进行统一处理,在程序执行过程中可以一次性载入。

dex文件的生成过程

通过编译器将源代码编译为.class字节码文件,将所有的.class字节码文件打包成一个Jar文件包,使用d8工具将Jar文件包转为dex格式。

Leb128

在 Dex(Dalvik Executable)文件格式中,LEB128(Little Endian Base 128) 是一种变长编码方式,用于紧凑地存储整数。

它有三种主要形式:

  • ULEB128(Unsigned LEB128) - 存储无符号整数

  • SLEB128(Signed LEB128) - 存储有符号整数

  • ULEB128P1(ULEB128 + 1) - 变体,适用于存储可为 -1 的索引值

文件格式详解

文件结构组成

dex文件中的数据类型

类型 含义
u1 等同于uint8_t,1字节无符号数
u2 等同于uint16_t,2字节无符号数
u4 等同于uint32_t,4字节无符号数
u8 等同于uint64_t,8字节无符号数
sleb128 有符号LEB128,可变长度1~5字节
uleb128 无符号LEB128,可变长度1~5字节
uleb128p1 无符号LEB128值加1,可变长度1~5字节
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
struct DexHeader {
u1 magic[8]; // 魔数
u4 checksum; // adler 校验值
u1 signature[kSHA1DigestLen]; // sha1 校验值
u4 fileSize; // DEX 文件大小
u4 headerSize; // DEX 文件头大小
u4 endianTag; // 字节序
u4 linkSize; // 链接段大小
u4 linkOff; // 链接段的偏移量
u4 mapOff; // DexMapList 偏移量
u4 stringIdsSize; // DexStringId 个数
u4 stringIdsOff; // DexStringId 偏移量
u4 typeIdsSize; // DexTypeId 个数
u4 typeIdsOff; // DexTypeId 偏移量
u4 protoIdsSize; // DexProtoId 个数
u4 protoIdsOff; // DexProtoId 偏移量
u4 fieldIdsSize; // DexFieldId 个数
u4 fieldIdsOff; // DexFieldId 偏移量
u4 methodIdsSize; // DexMethodId 个数
u4 methodIdsOff; // DexMethodId 偏移量
u4 classDefsSize; // DexCLassDef 个数
u4 classDefsOff; // DexClassDef 偏移量
u4 dataSize; // 数据段大小
u4 dataOff; // 数据段偏移量
};

string_ids

1
2
3
struct DexStringId {
u4 stringDataOff;
};

type_ids

1
2
3
struct DexTypeId {
u4 descriptorIdx;
};

proto_ids

1
2
3
4
5
struct DexProtoId {
u4 shortyIdx; /* index into stringIds for shorty descriptor */
u4 returnTypeIdx; /* index into typeIds list for return type */
u4 parametersOff; /* file offset to type_list for parameter types */
};

field_ids

1
2
3
4
5
struct DexFieldId {
u2 classIdx; /* index into typeIds list for defining class */
u2 typeIdx; /* index into typeIds for field type */
u4 nameIdx; /* index into stringIds for field name */
};

method_ids

1
2
3
4
5
struct DexMethodId {
u2 classIdx; /* index into typeIds list for defining class */
u2 protoIdx; /* index into protoIds for method prototype */
u4 nameIdx; /* index into stringIds for method name */
};

class_def

1
2
3
4
5
6
7
8
9
10
struct DexClassDef {
u4 classIdx; /* index into typeIds for this class */
u4 accessFlags;
u4 superclassIdx; /* index into typeIds for superclass */
u4 interfacesOff; /* file offset to DexTypeList */
u4 sourceFileIdx; /* index into stringIds for source file name */
u4 annotationsOff; /* file offset to annotations_directory_item */
u4 classDataOff; /* file offset to class_data_item */
u4 staticValuesOff; /* file offset to DexEncodedArray */
};