商会资讯

 找回密码
 立即注册

QQ登录

只需一步,快速开始

用新浪微博连接

一步搞定

搜索
热搜: 活动 交友 discuz
查看: 7347|回复: 0
打印 上一主题 下一主题

php序列化与反序列化时字符集不一致问题的解决办法

[复制链接]

109

主题

1

好友

3774

积分

管理员

Rank: 9Rank: 9Rank: 9

  • ta_mind
    mb_qb7
    2013-3-19 01:56
  • classn_01: 366 classn_02

    [LV.9]以坛为家II

    跳转到指定楼层
    楼主
    发表于 2017-10-28 17:07:14 |只看该作者 |倒序浏览
    今天的用PHP的时候无意的出现了用unserialize()函数转换老是返回false,我确认我的字符串是没错的,测试了很多次还是一样,没办法,启用了error_reporting(E_ALL)启用错误信息,
    没想到发现了Notice: unserialize() [function.unserialize]: Error at offset的信息, 因为我字符我是从数组转换过来的,所以应该是没有错的, Google了一下,原来是编码问题,
    在PHP手册的评论中有人讨论了此问题.
    原来我的字符串是从数据库里取出来的,而原来插入数据库时我的PHP用的是ANSCII编辑,而我复制出来后用unserialize()的PHP文件是UTF-8编码,编码不同,所以就出现错误了.
    例子:
    "首页以ANSCII方式操作
    <?php
    $arr = array('en' => 'hello', 'cn' => '您好');
    $str = serialize($arr);
    echo $str;
    ?>
    输出结果: a:2:{s:2:"en";s:5:"hello";s:2:"cn";s:4:"您好";}
    然后以UTF-8的编码方式来测试
    则以上代码的输出结果为: a:2:{s:2:"en";s:5:"hello";s:2:"cn";s:6:"您好";}
    "
    看到有什么不同了吧,在出现中文字符时字符长度就不一样了,也就是strlen('您好')在第一种编码中是4,而在第二种编码中是6,其中原因可以查看相关手册.
    而unsrialize()要根据类似 s:6:"您好" 中的6来判断字符长度并进行反序列,但原来的是4,字符长度不符,也就是出现了offset错误
    解决办法:
    "将要反序列的字符串进行一次转换,代码
    $str = preg_replace('!s\d+):"(.*?)";!se', '"s:".strlen("$2").":\"$2\";"', $str );
    或者用自己自定的函数来代替unserialize
    function mb_unserialize($serial_str) {
        $out = preg_replace('!s\d+):"(.*?)";!se', "'s:'.strlen('$2').':\"$2\";'", $serial_str );
        return unserialize($out);
    }
    测试过该方法 确实挺管用
    "
    PHP比较麻烦的非属编码问题不可了,我们在处理字符问题的时候,很多函数都要我们自己进行自定义重写,所以不是统一编码的好一点.


    分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    分享分享0 收藏收藏0 转发到微博
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    回顶部