微信小程序数据分析之自定义分析

在小程序后台,微信已经提供了强大的数据分析功能,包括实时统计、访问分析、来源分析和用户画像功能,可以说对一般的数据分析已经完全足够了,但有时应用需要做一些更加精准的数据分析,比如具体到某一个页面的分享,页面中某一个button的点击等,这时候就需要用到自定义分析功能。

什么是自定义分析?

引用下官方文档:

自定义分析支持灵活多维和近实时的用户行为分析,可以通过自定义上报,对用户在小程序内的行为做精细化跟踪,满足页面访问等标准统计以外的个性化分析需求。

创建自定义事件

进入自定义事件页面

  • 事件英文名称和事件中文名称按照说明要求填写,这两个名称都是唯一的,不能设置成已经设置过的,而且设置的时候尽量简洁、还要见名知意
  • 配置方式有:填写配置、API上报。
  • 配置模版:官方已经提供了一些自定义事件模版,直接使用就可以,包括有:进入页面、离开页面、小程序内分享,不过这些事件的分析粒度都比较粗,针对整个应用,可以自己修改只针对某一页
  • 填写配置的方式支持以下几种统计触发器,有:
1
2
3
4
5
6
7
8
9
10
11
click 点击时触发
enterPage 进入页面时触发,包括新开、后退、切换到前台都属于进入页面
leavePage 离开页面时触发,包括离开、切换到后台都属于离开页面
pageLoad 新开页面时触发,即第一次进入页面
pageUnload 回收页面时触发
pullDownRefresh 下拉刷新时触发
launch 加载小程序时触发
background 切换到后台触发
foreground 切换到前台触发
share 右上角菜单分享
switchTab 调用switchTab接口切换页面时触发

配置信息

  • action指出发时的动作,一次性上报,表示在每一次 click 中,收集数据并上报一条数据;分步骤上报我也还没搞懂 😅
  • page指要触发该事件的页面,这里填写的内容必须要和app.json中配置的页面路径一样
  • data是选填的,是用来给事件触发时传递一些数据的,其中,字段值就是当前page的data中的数据名称

举个例子🌰

电商类小程序中,用户会有一个点击商品添加到购物车的动作,我们可以对这个动作进行数据分析,以下是填写配置的方式:

  1. 填写事件英文和中文名称:

填写事件英文和中文名称

  1. 填写事件配置,定义如何收集数据:

填写事件配置

这个例子中,用一个动作上报“加入购物车”事件。

  • trigger:触发条件,click,表示点击操作触发;
  • action:触发时动作,一次性上报,表示在每一次 click 中,收集数据并上报一条数据;
  • page:触发页面,填 viewProduct(viewProduct 是商品详情页);
  • element:触发元素,填 .addToCart(.addToCart 是一个“加入购物车”的按钮);
  • data:事件的数据及其来源,用“字段名 字段值”来表示,其中字段值是页面上的一个变量。

详细说一下字段值,他有如下规则:

  • 填写的变量名,默认从page实例的data字段中获取
  • 若想收集由list变量渲染的列表中的某一项数据,则可用list[].*表示,这里会根据当前填写的element(只能是class)得到的NodeList的第几个来决定数组下标。
  • 若列表是二维的,则可用list[][].*表示,这里element需填写两个class(空格隔开)分别表示父列表与子列表。
  • 若想取得数组的下标,则可用list[].$INDEX表示
  • 若想取得wxml中data-系列属性的值,则可用$DATASET.表示
  • 若想取得app实例的数据,则可用$APP.*表示,只支持获取基本类型的数据,如number、string、boolean。

除此之外,还可以填写一些提供的系统属性,以“$”开头,目前支持以下属性:

  • $PAGE_TIME 用户从进入本页面到当前的时间(触发action的时间点)
  • $APP_TIME 用户进入小程序到当前的时间(触发action的时间点)
  • $CURRENT_PAGE 当前用户所在的页面
  • $LAST_PAGE 上一页

注:data可以为空,为空时该事件上报仅收集系统默认字段的数据

这个例子中,data有四项:

product_id: itemID

product_name: itemName

product_price: price

product_category: category

即:

事件的product_id字段,收集viewProduct页面上page实例的data中的itemID字段;

事件的product_name字段,收集viewProduct页面上page实例的data中的itemName字段;

事件的product_price字段,收集viewProduct页面上page实例的data中的price字段;

事件的product_category字段,收集viewProduct页面上page实例的data中的category字段;

以上内容表示:当用户点击 viewProduct 页面上的 .addToCart 按钮时,上报一条记录到 add_to_cart 事件,事件的 product_id, product_name, product_price, product_category 字段, 取值分别是页面上的 itemID, itemName, price, category。

填写完配置后,还要点击检查字段

此时会提示 add_to_cart 事件包含的具体字段,继续补充字段的名称、数据类型和备注信息。

关于API上报

API上报比填写配置的方式更加灵活,但这也涉及到一些代码的更改,需要发布新版本,而填写配置的方式几乎不需要更改代码,所以无需发布新版本。当我们选择API上报后,我们可以设置需要上报的一下参数:

API上报

点击生成代码:

时间创建完成后,点击保存,后台就生成了一条事件记录,并有唯一的ID与它对应:

接着,我们在小程序代码中可以插入生成的代码,如下是我在转发成功后的success()回掉函数中提交API上报。

1
2
3
4
5
6
7
8
9
...
// 转发成功
success: function (res) {
wx.reportAnalytics('click_share', {
page_path: current_page_path,
from: from,
});
},
...

不管是填写配置还是API上报,都需要在填写完配置后保存并测试。

我们在测试事件的时候,往往要过一段时间才能接收到数据,大概1-2分钟,为了能够及时判断正确性,我们可以在手机上的小程序应用中,打开调试,这样,每次触发事件时,都会在控制台的Log中看到[自定义分析]上报成功的字样,点击查看还能看到更多数据,比如上报的参数等,里面的eventID就对应事件的英文名称,可以通过这种方式快速判断事件触发是否符合预期,如下截图:

通过使用,我们发现小程序的自定义分析功能很强大,你可以在页面上分析任何元素、任何事件,使我们可以全方位的了解到小程序的使用情况,对数据加以分析总结,并以数据来驱动产品的迭代,提高用户留存。

参考:小程序官方文档 https://developers.weixin.qq.com/miniprogram/analysis/custom

部分语言URL正则匹配

开发中,经常会需要做一些正则匹配,比如手机号验证,email验证,URL匹配等,写此篇文章主要是记录如何使用正则表达式匹配URL,方便以后再遇到此问题时不必到处搜索而得不到满意的答案。

PHP(使用preg_match)

1
%^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@|\d{1,3}(?:\.\d{1,3}){3}|(?:(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)(?:\.(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)*(?:\.[a-z\x{00a1}-\x{ffff}]{2,6}))(?::\d+)?(?:[^\s]*)?$%iu

PHP(使用validate filter)

1
if (filter_var($url, FILTER_VALIDATE_URL) !== false)...

Python

1
http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+

Javascript

1
/((([A-Za-z]{3,9}:(?:\/\/)?)(?:[\-;:&=\+\$,\w]+@)?[A-Za-z0-9\.\-]+|(?:www\.|[\-;:&=\+\$,\w]+@)[A-Za-z0-9\.\-]+)((?:\/[\+~%\/\.\w\-_]*)?\??(?:[\-\+=&;%@\.\w_]*)#?(?:[\.\!\/\\\w]*))?)/

HTML5

1
<input type="url" />

匹配上面input输入的URL(RFC3986

1
^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?

Perl

1
^(((ht|f)tp(s?))\://)?(www.|[a-zA-Z].)[a-zA-Z0-9\-\.]+\.(com|edu|gov|mil|net|org|biz|info|name|museum|us|ca|uk)(\:[0-9]+)*(/($|[a-zA-Z0-9\.\,\;\?\'\\\+&%\$#\=~_\-]+))*$

Ruby

1
/\A(?:(?:https?|ftp):\/\/)(?:\S+(?::\S*)?@)?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|(?:(?:[a-z\u00a1-\uffff0-9]+-?)*[a-z\u00a1-\uffff0-9]+)(?:\.(?:[a-z\u00a1-\uffff0-9]+-?)*[a-z\u00a1-\uffff0-9]+)*(?:\.(?:[a-z\u00a1-\uffff]{2,})))(?::\d{2,5})?(?:\/[^\s]*)?\z/i

Go (使用govalidator.IsURL)

1
2
3
4
5
6
7
8
9
10
package main
import (
"fmt"
"github.com/asaskevich/govalidator"
)
func main() {
str := "http://www.urlregex.com"
validURL := govalidator.IsURL(str)
fmt.Printf("%s is a valid URL : %v \n", str, validURL)
}

Objective-C

1
(http|https)://((\\w)*|([0-9]*)|([-|_])*)+([\\.|/]((\\w)*|([0-9]*)|([-|_])*))+

Swift

1
((?:http|https)://)?(?:www\\.)?[\\w\\d\\-_]+\\.\\w{2,3}(\\.\\w{2})?(/(?<=/)(?:[\\w\\d\\-./_]+)?)?

定义一个函数方法:

1
2
3
4
5
func canOpenURL(string: String?) -> Bool {
let regEx = "((https|http)://)((\\w|-)+)(([.]|[/])((\\w|-)+))+"
let predicate = NSPredicate(format:"SELF MATCHES %@", argumentArray:[regEx])
return predicate.evaluateWithObject(string)
}

使用:

1
2
3
4
5
if canOpenURL("http://www.urlregex.com") {
print("valid url.")
} else {
print("invalid url.")
}

Swift (使用官方提供的canOpenURL)

1
UIApplication.sharedApplication().canOpenURL(urlString)

Java

1
^(https?|ftp|file)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]

VB.NET

1
(http(s)?://)?([\w-]+\.)+[\w-]+[.com]+(/[/?%&=]*)?

C

1
^(ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9\-\.\?\,\'\/\\\+&%\$#_]*)?$

MySQL

1
2
3
SELECT field FROM table 
WHERE field
REGEXP "^(https?://|www\\.)[\.A-Za-z0-9\-]+\\.[a-zA-Z]{2,4}

整理自:http://urlregex.com

解决PHP中htmlspecialchars返回null的问题

在开发中,经常需要对用户传过来的数据进行过滤,来阻止一些用户的恶意输入,在PHP中常用到htmlspecialchars()htmlentities()strip_tags()函数来处理。

今天在使用htmlspecialchars()做特殊字符的转换时,一直返回null,当我换成htmlentities()也是同样的问题,查官方手册才发现原来是编码的问题。

函数声明:

问题主要处在第三个参数上,对于第三个参数官方是这么说的:

这个参数的作用是设置转换字符时采用的编码,在PHP 5.4 和5.5中使用了UTF-8作为默认编码,而在PHP 5.4之前使用ISO-8859-1作为默认编码,从PHP 5.6开始就使用PHP配置文件中的default_charset参数作为默认编码。encoding参数支持的字符集:

从PHP的更新日志也能看到这个参数的变化:

一般我们是这么使用的:

1
2
3
$str='<a href="test.html">\'测试页面\'</a><script>alert(213)</script>';
echo htmlspecialchars($str);
// 输出:&lt;a href=&quot;test.html&quot;&gt;'测试页面'&lt;/a&gt;&lt;script&gt;alert(213)&lt;/script&gt;

今天在使用的时候,结果一直返回null,其实就是编码的问题,这个时候就需要用到第三个参数了:

1
echo htmlspecialchars($string, ENT_COMPAT,'ISO-8859-1', true);

同样,也适用于htmlentities

1
echo htmlentities($string, ENT_COMPAT,'ISO-8859-1', true);

MySQL中的索引学习

什么是索引?

在没有学数据库之前,大多数人对索引还是比较陌生(可能学完之后还是比较陌生:),今天我想告诉大家索引很有用,而且面试的时候都会问到。那么索引是什么呢?

其实索引这个东西我们很早就接触过了,想象一下当初学习《现代汉语词典》的时候,老师是如何教我们使用的,就可以理解什么是索引了。《现代汉语词典》有将近1800页,里面的汉字大概有1.3万多个,我们是如何在这么多的汉字中找到某个字呢?老师大概是这么教我们的:词典提供了“音节表”,“音节表”将所有汉子的汉语拼音编入其中,并且“音节表”按’a’到’z’的顺序排序,故而我们可以轻松的在音节表中找到某个字所对应的页数。其实不光是词典,我们看的书大部分都有目录,而这个目录就相当于索引的作用,如下是三本书的目录:

《禅与摩托车维修艺术》的目录

《黑客与画家》的目录

《计算机程序的构造和解释》的目录

通过上面三本书的目录的对比,很明显第一本书的目录写的很简单,第二本书稍详细一点,而第三本书的目录最详细,目录写得越详细,读者在阅读的时候就越方便。

不管是词典中的音节表还是书的目录,它们实际都是索引的一种存在形式,都是为了能够提高查找的效率。

数据库中索引的本质

本质上,索引其实是数据库表中字段值的复制,该字段称为索引的关键字。

索引在计算机中的存储

在学习数据结构时,曾讲到文件的概念,而数据库中所有的数据都是以文件的形式保存的计算机中的,所以文件系统是数据库系统的基础。而数据库在操作这些文件时,都是先将文件中的数据加载到内存,然后再以某种数据结构来操作这些数据,通常的数据结构可以是AVL树B树B+树等。数据库中的往往是要存大量的数据的,而所有的数据不可能一次性全部加载到内存中,这时候就需要索引与分块加载来提高查询的速度,不过一般初学者不会体验到索引带来的高效,因为他们的电脑内存足够大完全可以一次性加载完所有数据,这也导致初学者忽略了对索引的仔细学习。如下是MyISAM存储引擎的索引示意图:

MyISAM存储引擎teacher表的主索引及普通索引

更多关于数据库索引背后的数据结构和算法原理,请查看:https://www.cnblogs.com/tgycoder/p/5410057.html

MySQL中的索引

在MySQL中,共有4类索引:主键索引、唯一索引、常规索引和全文索引。

主键索引(Primary key)

主键索引是关系数据库中最常见的索引类型。它根据主键自身的唯一性来唯一标识每条记录。因此该键必须是表中的唯一值。创建主键索引很简单,如下:

每个表只能有一个自增字段,该字段必须指定为主键。此外,任何指定为主键的字段不能是NULL,即使没有声明为NOT NULL,MySQL会自己设置。

唯一索引(Unique)

与主键索引一样,唯一索引可以防止创建重复的值。不同之处在于每个表只能有一个主键索引,但可以有多个唯一索引。修改上面的sql语句来增加唯一索引:

如前面所讲,表中可以指定多个唯一字段,我们现在将name字段也设置为唯一:

还可以指定多列唯一索引,比如上面的表结构中,允许用户插入重复的url,甚至可以插入重复的name值,但不希望出现重复的name和url的组合。可以创建多列唯一索引来强制这种约束,如下:

常规索引(Index)

可能经常需要对数据库的搜索效率进行优化,以便能够根据并非主键甚至并非唯一的列获取数据行。为此,最有效的方法是采用某种方式索引列,是的数据库尽可能快的查找想要的值。这就称为常规索引。

单列常规索引

如果表中的某个列经常需要被查询到,就应该使用单列常规索引。假如,一张员工表you 4列:主键id,名字,姓氏和电子邮箱,若果大多数的查询操作都会针对员工的姓氏或者电子邮箱,因为员工的姓氏可以有重复的,而电子邮箱必须唯一,我们就可以给姓氏创建一个常规索引,电子邮箱创建一个唯一索引,如下:

同时,MySQL还提供了创建局部字段索引的特性,方式是:将某一字段的前N的字符作为索引,相比于单列常规索引,局部索引需要更少的磁盘空间,同时由于索引的数据短,因此效率会高一点。修改前面的示例,因为通常lastname的前5个字符就足以确保获取到唯一的数据,修改如下:

多列常规索引

一般查询时,通常需要包含多列,我们可以指定一些经常被查询的列为多列常规索引。MySQL的多列常规索引方法基于一种最左前缀(leftmost prefixing)的策略。最左前缀指出包含列A、B和C的任何多列索引都可以提高涉及如下列组合的查询的性能:

  • A、B、C
  • A、B
  • A

创建多列索引:

上图中创建了三个索引,第一个是主键索引,第二个是电子邮箱的唯一索引,第三个就是多列索引,包括两列:lastname和firstname。

全文索引

当字段类型为char、varchar或text时,我们可以使用全文索引。在MySQL中,对大量自然语言做全文搜索时,它提供了一种数据获取的机制,并生成最符合用户需要的结果。比如在对这样“Nginx is the world’s most popular web server”的字符串进行搜索时,单词is和the对结果几乎起不了任何作用,MySQL在搜索时,将文本分解为单词,默认忽略少于4个字符的单词。创建全文索引:

创建全文索引的方式与创建其他索引没什么区别,但基于全文索引的查询却有一点不同。在查询时,select语句需要使用两个特殊的MySQL函数match()againet()。查询方式如下:

Boolean全文搜索

Boolean全文搜索对查询提供了更加细的控制允许显示地标识候选结果中应当或不应当出现哪些词(MySQL默认会忽略少于4个字符的关键词)。以下是关于Boolean操作符的描述:

+ 前导加号确保后面的单词出现在每个结果记录中
- 前导减号确保后面的单词不出现在任何结果记录中
* 结尾处的星号允许接受关键字变体,只要该变体以星号前面的单词所制定的字符串开头
“ “ 外围的双引号确保结果记录包含所包围的字符串,要严格按照输入时的形式出现
< > 前导的大于号和小于号分别用于增加和减少后面单词的搜索级别相关度
( ) 小括号用于将单词分组为子表达式

如下是几个简单的例子:

  1. 返回包含Nginx,但不包含manual的记录:

  1. 返回包含单词Nginx,但不包含Apache或Tomcat的记录:

  1. 返回包含web和scripting或者php和scripting的记录,但web scripting的搜索级别低于php scripting:

注意,由于MySQL默认会忽略少于4个字符的单词,所以执行上面的SQL命令时,应该先修改ft_min_word_len参数。

索引选取的注意事项

  1. 只对WHEREORDER BY子句中需要的列添加索引,过多的索引会占用很多硬盘空间,在修改数据时还会降低性能,因为每次修改数据时都需要更新索引。
  2. 如果创建如INDEX(firstname, lastname)的索引时,不要再创建INDEX(firstname),因为MySQL的索引采用最左前缀策略。
  3. 需要索引的列要不为空(NOT NULL),保证构建索引时不存储NULL值。
  4. 可以开启慢查询日志,通过对慢查询日志的分析来优化索引。

参考:
《PHP与MySQL程序设计(第四版)》

PHP中的static关键字

PHP和Java中都会有static这个关键字,用法也类似,当问及PHP中的static用法是,很容易想出static可以声明类属性或方法为静态,静态属性和方法都是属于类的,静态属性不能通过对象访问,但静态方法可以通过对象访问。没错,是这样的,但是在PHP中static还有另外的用处哦。

先从static变量的作用域开始

PHP中static变量只存在于本地函数中,但是当程序执行完本函数后,static变量还会一直存在,考虑如下代码:

1
2
3
4
5
6
7
8
9
10
11
12
<?php
function test()
{
$a = 0;
echo $a . "\n";
$a++;
}

// 都会输出0
for ($i=0; $i<5; $i++) {
test();
}

在每次调用这个函数的时候,函数都会将$a变量置0,再输出,尽管每次输出后,变量$a都加1了,为了每次都能将$a的值保存起来,我们可以将它声明为static

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
<?php
function test()
{
static $a = 0;
echo $a . "\n";
$a++;
}

// 输出
// 0
// 1
// 2
// 3
// 4
for ($i=0; $i<5; $i++) {
test();
}

现在,$a只被初始化了一次,每次调用test()函数时,$a都会加1。

在递归函数中,同样可以使用静态变量,我们可以设置一个$count静态变量的函数运行计数器,保存运行的次数,当$count到10时,就退出递归函数,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
<?php
function test()
{
static $count = 0;

$count++;
echo $count;
if ($count < 10) {
test();
}
}

test();

静态变量初始化时只能是确定的一个值,不能是函数的返回值,下面的代码中,将sqrt()函数的结果赋值给静态变量$a会报错:

1
2
3
4
5
6
7
8
9
function foo(){
static $a = 0; // correct
static $a = 1+2; // correct (as of PHP 5.6)
static $a = sqrt(121); // wrong (as it is a function)

echo $a;
}

foo();

程序没有运行前,再phpstorm中就已经其实不能用表达式初始化静态变量:

程序运行时也会报如下错误:

声明类属性或方法为静态

声明类属性或方法为静态,就可以不实例化类而直接访问。静态属性不能通过一个类已实例化的对象来访问(但静态方法可以)。为了兼容 PHP 4,如果没有指定访问控制,属性和方法默认为公有。由于静态方法不需要通过对象即可调用,所以伪变量 $this 在静态方法中不可用。静态属性不可以由对象通过 -> 操作符来访问。用静态方式调用一个非静态方法会导致一个 E_STRICT 级别的错误。就像其它所有的 PHP 静态变量一样,静态属性只能被初始化为文字或常量,不能使用表达式。所以可以把静态属性初始化为整数或数组,但不能初始化为另一个变量或函数返回值,也不能指向一个对象。自 PHP 5.3.0 起,可以用一个变量来动态调用类。但该变量的值不能为关键字 self,parent 或 static。如下是静态属性的示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
<?php
class Foo
{
public static $my_static = 'foo';

public function staticValue() {
return self::$my_static;
}
}

class Bar extends Foo
{
public function fooStatic() {
return parent::$my_static;
}
}


print Foo::$my_static . "\n";

$foo = new Foo();
print $foo->staticValue() . "\n";
print $foo->my_static . "\n"; // 对象不能使用->符号调用静态变量

print $foo::$my_static . "\n";
$classname = 'Foo';
print $classname::$my_static . "\n"; // 5.3开始可以使用变量调用类

print Bar::$my_static . "\n";
$bar = new Bar();
print $bar->fooStatic() . "\n";

运行结果如下:

作为静态变量,还可以在多个对象之间共享数据,创建好几个对象的时候,因为每次都是new的,所以创建的对象都不同,如果想让多个对象实例共享同一个变量,就可以用到静态变量。假设要编写一个类来跟踪网页浏览的人数,肯定不希望每次实例化该类时都把访问者数量置0,只是就可以将该属性设置为static

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<?php
class Visitor
{
private static $visitors = 0;

public function __construct()
{
self::$visitors++;
}

public static function getVisitors()
{
return self::$visitors;
}
}

// 实例化
$visitor1 = new Visitor();
echo Visitor::getVisitors() . "\n"; // 1

$visitor2 = new Visitor();
echo Visitor::getVisitors() . "\n"; // 2

延迟静态绑定

PHP中的static关键字除了上述比较熟知的作用外,还可以作为延迟静态绑定使用,这是在5.3版本后才加入的功能。

先看如下的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
<?php
abstract class DomainObject
{

}

class User extends DomainObject
{
public static function create()
{
return new User();
}
}

class Document extends DomainObject
{
public static function create()
{
return new Document();
}
}

首先创建了一个抽象类,然后创建了两个子类UserDocument分别继承自DomainObject抽象类,这个代码运行起来完全没问题,而且能很好的工作,如果你是一位懒惰的程序猿,看到这样重复的代码你会很恼火,尤其是重复代码比较多的时候,就会想着如何重构它。每个DomainObject子类都有一个相同的create()函数,我们试着把它放入父类当中去:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<?php
abstract class DomainObject
{
public static function create()
{
return new self();
}
}

class User extends DomainObject
{
}

class Document extends DomainObject
{
}

Document::create();

很明显phpstorm会提示出错,我们试着运行会得到以下错误:

在上面的例子中,self对该类所起的作用与$this对对象所起的作用不完全相同,self被解析为定义create()DomainObject,而不是解析为调用selfDocument类。在PHP 5.3中延迟静态绑定的概念,最明显的标志就是使用static关键字,它指向的是被调用的类而不是包含类。上面的代码我们可以这么改:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<?php
abstract class DomainObject
{
public static function create()
{
return new static();
}
}

class User extends DomainObject
{
}

class Document extends DomainObject
{
}

print_r(Document::create());

输出:

static关键字不仅可以用于实例化,和selfparent一样,static还可以作为静态方法调用的标识符,甚至是从非静态上下文中调用。例如为DomainObject引入组的概念,默认组为default,可以用static为继承层次结构的某些子类重写组,代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
<?php
abstract class DomainObject
{
private $group;
public function __construct()
{
$this->group = static::getGroup();
}

public static function create()
{
return new static();
}

public static function getGroup()
{
return "default";
}
}

class User extends DomainObject
{

}

class Document extends DomainObject
{
public static function getGroup()
{
return "document";
}
}

class SpreadSheet extends Document
{

}

print_r(User::create());
print_r(SpreadSheet::create());

代码中,DomainObject的构造函数使用static调用静态方法getGroup(),设置默认组为default,在Document中重写了getGroup()方法,重新设置了组,下面是输出结果:

PHP静态绑定的一个应用

该例子来自简书:https://www.jianshu.com/p/25a78620fa5c

需求

做的某项目有一个“转账”的功能,但是转账的类型有很多种,对应每种转账需要的参数也不同,举个例子一种转账是由系统转账给用户,那么就只有接收方和金额两个参数,另一种转账是用户之间的转账且支持留言,那么就有发送方接收方金额和留言四个参数。当然最简单的思路就是采用四个参数,对于第一种转账将不用的两个参数留空,这种方法的问题在于,考虑到未来可能增加的新的转账类型,可能会引入新的参数,那么代码很可能需要推倒重来,有没有更优雅的解决方式呢?

一个例子

其实Laravel里就有实现类似需求的例子,那就是查询构造器(Query Builder),它的一个使用的例子如下:

1
2
3
4
5
$users = DB::table('users')
->select(DB::raw('count(*) as user_count, status'))
->where('status', '<>', 1)
->groupBy('status')
->get();

这个方法和我们的需求就很像了,对于查询这一功能,传入哪些参数是未知的,例如某次具体的查询,可能需要调用groupBy也可能调用orderBy,也可能两者需要同时调用或者都不调用。一个思路就是针对每一个参数都写一个方法,需要时则调用,不需要时则不调用。

解决方案

整体的解决思路是写两个类,一个叫Transfer,一个叫Builder,每个参数对应的方法写在Builder里,由Transfer去调用Builder构造我们需要的转账类型,完成相关操作。这样当需求更新时(要增加新的参数时),只要在Builder里添加相应的方法即可,而不用改动现有代码。下面先贴一下对应的代码再做详细解释。
Transfer类代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
class Transfer
{
public function __call($method, $parameters)
{
$builder = new Builder();
return call_user_func_array([$builder, $method], $parameters);
}

public static function __callStatic($method, $parameters)
{
$instance = new static;
return call_user_func_array([$instance, $method], $parameters);
}
}

Builder类实际上只涉及到具体的功能实现,就贴部分代码意思意思看看就行:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
class Builder
{
protected $from = 0; // 0 represents system
protected $to = 0;
protected $amount = 0;
protected $comments = '';
protected $related = [];

public function from($user)
{
if ($user instanceof User) {
$this->from = $user->getAuthIdentifier();
} elseif (is_int($user)) {
$this->from = $user;
} else {
throw new InvalidArgumentException(sprintf('%s excepts $user parameter to be \App\User or integer, %s given.', __METHOD__, gettype($user)));
}
return $this;
}
public function to($user){...}
public function amount(int $amount){...}
public function comments($comments){...}
public function related(int $type, int $id, $extra = null){...}
public function transfer(){...}
}

具体调用Transfer功能的代码:

1
Transfer::from($sender)->to($receiver)->amount($amount)->comments($comments)->related($related_type, $related_id, $related_extra)->transfer();

下面我们来走一遍调用Transfer的流程来看看。首先调用了Transfer类中的静态方法from,然而Transfer中并不存在这个静态方法,则会自动调用__callStatic()这个魔术方法。这个方法首先实例化了一个static对象。注意这里的static是一个类名,new出来的$instance是属于static这个类的一个实例化对象,有点拗口然后返回时调用了call_user_func_array这个方法,这个方法具体可以参考php的手册,实际上它完成了类似$instance->method($parameters)这样的操作,放到我们当前的情境下实际执行了$transfer_instance->from($user)这样的操作。

然后发觉Transfer中并不存在这个动态方法,于是又会自动调用__call()这个魔术方法。这个方法首先创建了一个Builder类的实例,之后调用call_user_func_array这个方法,实际上相当于执行了$builder->from($user)方法,然后终于得Builder类里找到了这个from()方法,注意它的返回值是$this。

然后当前这个Builder这个对象继续调用to方法,发觉又不存在又去调用__call()这个魔术方法,之后的过程同上,反复调用Builder中的方法把所有需要的参数都处理过以后最后调用了transfer()方法最终完成转账操作。

参考:

http://www.php.net/manual/zh/language.oop5.static.php
https://www.jianshu.com/p/25a78620fa5c

欢迎关注我的公众号: