用runtime看OC中类与对象,消息的底层实现原理

iOS 42 2017-11-07 22:54

1.OC的类和对象

先看一下类和对象的数据结构:

typedef struct objc_class *Class;//类对象

struct objc_class {//类对象的结构体

Class isa  OBJC_ISA_AVAILABILITY;//meta-class里存储类方法,meta-class的isa指向根类,super_class指向父类的meta-class。

#if !__OBJC2__

Class super_class                                        OBJC2_UNAVAILABLE;

const char *name                                        OBJC2_UNAVAILABLE;

long version                                            OBJC2_UNAVAILABLE;

long info                                                OBJC2_UNAVAILABLE;

long instance_size                                      OBJC2_UNAVAILABLE;

struct objc_ivar_list *ivars                            OBJC2_UNAVAILABLE;

struct objc_method_list **methodLists                    OBJC2_UNAVAILABLE;

struct objc_cache *cache                                OBJC2_UNAVAILABLE;

struct objc_protocol_list *protocols                    OBJC2_UNAVAILABLE;

#endif

} OBJC2_UNAVAILABLE;

struct objc_object {//实例对象结构体

Class isa  OBJC_ISA_AVAILABILITY;

};

typedef struct objc_object *id;//实例对象

每个对象都会有一个它所属的类。这是面向对象的基本概念,但是在OC中,这对所有数据结构有效。任何数据结构,只要在恰当的位置具有一个指针指向一个class,那么,它都可以被认为是一个对象。objc_class和objc_object的struct指针都能称为对象,我们为了区分可以把它们分别叫做类对象和实例对象,其中实例对象的isa指针指向类对象。

在OC中,一个对象所属于哪个类,是由它的isa指针指向的。这个isa指针指向这个对象所属的class。

我们看一下类对象的结构体objc_class:Class isa指向的就是metaclass,当我们向一个类发送消息的时候,就是调用metaclass里面的方法,如[NSString defaultStringEncoding],Class super_class指向父类。同样metaclass的结构体也是objc_class,它的Class isa指向直接指向根类的metaclass,根类的metaclass则是指向自身;它的Class super_class指向父类的metaclass;super_class的结构体也是objc_class,它的Class isa指向也是直接指向根类的metaclass,如果父类也有一个父类,它的Class super_class就是想父类。

类对象的结构体objc_class里面用Class super_class指向父类是为了实现继承;Class isa指向的就是metaclass则是为了实现向类发消息(也就是类方法),同时让类和对象有了区分。


用runtime看OC中类与对象,消息的底层实现原理-JEESNS
完美闭环


为了验证以上所述,我新建一个类Yordles继承NSObject,然后再新建一个类Timor继承Yordles,用clang rewrite成c的实现

Timor类截取主要代码如下:

static void OBJC_CLASS_SETUP_$_Timor(void ) {

OBJC_METACLASS_$_Timor.isa = &OBJC_METACLASS_$_NSObject;

OBJC_METACLASS_$_Timor.superclass = &OBJC_METACLASS_$_Yordles;

OBJC_METACLASS_$_Timor.cache = &_objc_empty_cache;

OBJC_CLASS_$_Timor.isa = &OBJC_METACLASS_$_Timor;

OBJC_CLASS_$_Timor.superclass = &OBJC_CLASS_$_Yordles;

OBJC_CLASS_$_Timor.cache = &_objc_empty_cache;

}

Yordles类截取相关代码如下:

static void OBJC_CLASS_SETUP_$_Yordles(void ) {

OBJC_METACLASS_$_Yordles.isa = &OBJC_METACLASS_$_NSObject;

OBJC_METACLASS_$_Yordles.superclass = &OBJC_METACLASS_$_NSObject;

OBJC_METACLASS_$_Yordles.cache = &_objc_empty_cache;

OBJC_CLASS_$_Yordles.isa = &OBJC_METACLASS_$_Yordles;

OBJC_CLASS_$_Yordles.superclass = &OBJC_CLASS_$_NSObject;

OBJC_CLASS_$_Yordles.cache = &_objc_empty_cache;

}

2.objc_msgSend

在我们传消息的时候(比如[NSString defaultStringEncoding],[timor wait]),在c层面一般都会转化成objc_msgSend方法。在讨论objc_msgSend的工作原理前,我们先看几个结构体

Method

Method表示类中的某个方法,在runtime.h文件中找到它的定义:

/// An opaque type that represents a method in a class definition.

typedef struct objc_method *Method;

struct objc_method {

SEL method_name                                          OBJC2_UNAVAILABLE;

char *method_types                                      OBJC2_UNAVAILABLE;

IMP method_imp                                          OBJC2_UNAVAILABLE;

}

其实Method就是一个指向objc_method结构体指针,它存储了方法名(method_name)、方法类型(method_types)和方法实现(method_imp)等信息。而method_imp的数据类型是IMP,它是一个函数指针,后面会重点提及。

Ivar

Ivar表示类中的实例变量,在runtime.h文件中找到它的定义:

/// An opaque type that represents an instance variable.

typedef struct objc_ivar *Ivar;

struct objc_ivar {

char *ivar_name                                          OBJC2_UNAVAILABLE;

char *ivar_type                                          OBJC2_UNAVAILABLE;

int ivar_offset                                          OBJC2_UNAVAILABLE;

#ifdef __LP64__

int space                                                OBJC2_UNAVAILABLE;

#endif

}

Ivar其实就是一个指向objc_ivar结构体指针,它包含了变量名(ivar_name)、变量类型(ivar_type)等信息。

IMP

在上面讲Method时就说过,IMP本质上就是一个函数指针,指向方法的实现,在objc.h找到它的定义:

/// A pointer to the function of a method implementation.

#if !OBJC_OLD_DISPATCH_PROTOTYPES

typedef void (*IMP)(void /* id, SEL, ... */ );

#else

typedef id (*IMP)(id, SEL, ...);

#endif

当你向某个对象发送一条信息,可以由这个函数指针来指定方法的实现,它最终就会执行那段代码,这样可以绕开消息传递阶段而去执行另一个方法实现。

Cache

顾名思义,Cache主要用来缓存,那它缓存什么呢?我们先在runtime.h文件看看它的定义:

typedef struct objc_cache *Cache                            OBJC2_UNAVAILABLE;

struct objc_cache {

unsigned int mask /* total = mask + 1 */                OBJC2_UNAVAILABLE;

unsigned int occupied                                    OBJC2_UNAVAILABLE;

Method buckets[1]                                        OBJC2_UNAVAILABLE;

};

Cache其实就是一个存储Method的链表,主要是为了优化方法调用的性能。当对象receiver调用方法message时,首先根据对象receiver的isa指针查找到它对应的类,然后在类的methodLists中搜索方法,如果没有找到,就使用super_class指针到父类中的methodLists查找,一旦找到就调用方法。如果没有找到,有可能消息转发,也可能忽略它。但这样查找方式效率太低,因为往往一个类大概只有20%的方法经常被调用,占总调用次数的80%。所以使用Cache来缓存经常调用的方法,当调用方法时,优先在Cache查找,如果没有找到,再到methodLists查找

看了那么多元素概念,我们请出objc_msgSend在message.h中的定义:

/**

* Sends a message with a simple return value to an instance of a class.

*

* @param self A pointer to the instance of the class that is to receive the message.

* @param op The selector of the method that handles the message.

* @param ...

*  A variable argument list containing the arguments to the method.

*

* @return The return value of the method.

*

* @note When it encounters a method call, the compiler generates a call to one of the

*  functions \c objc_msgSend, \c objc_msgSend_stret, \c objc_msgSendSuper, or \c objc_msgSendSuper_stret.

*  Messages sent to an object’s superclass (using the \c super keyword) are sent using \c objc_msgSendSuper;

*  other messages are sent using \c objc_msgSend. Methods that have data structures as return values

*  are sent using \c objc_msgSendSuper_stret and \c objc_msgSend_stret.

*/

OBJC_EXPORT id objc_msgSend(id self, SEL op, ...)

OBJC_AVAILABLE(10.0, 2.0, 9.0, 1.0);

上面的注释翻译过来就是:

当编译器遇到一个方法调用时,它会将方法的调用翻译成以下函数中的一个 `objc_msgSend`、`objc_msgSend_stret`、`objc_msgSendSuper` 和 `objc_msgSendSuper_stret`。

发送给对象的父类的消息会使用 `objc_msgSendSuper`

有数据结构作为返回值的方法会使用 `objc_msgSendSuper_stret` 或 `objc_msgSend_stret`

其它的消息都是使用 `objc_msgSend` 发送的

现在让我们看一下objc_msgSend它具体是如何发送消息:

首先根据receiver对象的isa指针获取它对应的class;

优先在class的cache查找message方法,如果找不到,再到methodLists查找;

如果没有在class找到,再到super_class查找;

一旦找到message这个方法,就执行它实现的IMP。


用runtime看OC中类与对象,消息的底层实现原理-JEESNS
message

你以为objc_msgSend到这里就结束了,显然不是,这只是针对有方法实现的plan a,当objc_msgSend找不到实现的IMP时,程序并不会直接崩溃,而是给开发者一个plan b:方法决议与消息转发。这是有一组NSObject里的方法实现的,开发者只需要重写响应的方法即可。具体流程如图:


用runtime看OC中类与对象,消息的底层实现原理-JEESNS
方法决议与消息转发


注意:第一步当方法为实例方法时用:resolveInstanceMethod ,方法为类方法时用resolveClassMethod

文章评论