论百度云屏蔽资源原理和如何反屏蔽资源

论百度云屏蔽资源原理和如何反屏蔽资源

以下是网络上搜集而来的相关信息。

『1,百度云是如何分析出非法文件的』

百度云根据举报内容综合整理计算出非法文件的所谓“特征码”。

特征码原先只是用来缓解网盘服务器上传负载过大的压力。当用户试图上传某文件时,网盘客户端会在本地校验文件的“特征码”并且和服务器上已有文件的“特征码”进行比对,比对匹配的,直接在你的客户端添加该文件,并显示“上传成功”,但其实并没有真正把你的文件通过网络,所谓上传好的不过是在你之前别人早就完成上传罢了(这也就是所谓“秒传”“极速上传”)

同样,百度云通过计算你文件的“特征码”,经过比对发现和已知的非法文件“特征码”一致,于是直接替换你的文件为百度的屏蔽文件。这样做大大减少了人工审核的繁琐。

『2,防止文件被百度云屏蔽的有效方法』

道高一尺魔高一丈,虽然文件遭到屏蔽,但是我们还是有各种各样的方法来应对。

个人建议:敏感资源压缩加密上传。切记,压缩包一定要用强度较高的密码,把文件名也加密,密码至少要在八个字符以上,最好是中文的,或者毫无逻辑,建议压缩为.rar进行加密,不建议压缩为.zip。

为什么不推荐zip?

关于压缩文件的算法(感兴趣的可以看一下)

都说RAR加密的文件固若金汤(那些密码简单得让人无语的不算),但是为什么会这样呢?RAR的加密算法简单来说就是两步:

1:先把源文件压缩,压成一段数据段。

2:再将压缩完的数据段加密。

把数据压缩成数据段一步,相当于把一个未压缩的文件进行压缩;重点在第二步:

加密时会通过某些算法得到两个不同算法的密钥。一个用于加密文件,我们可以称它为密钥A,另一个叫它密钥B。

加密时每16个字节分成一个块,密钥A进行文件加密,密钥B对上一个密钥A加密过的数据块进行异或运算。

解密时通过输入的密码重新生成两个密钥,按照新密钥对加密文件进行逆运算,再对逆运算的结果的CRC与源文件的CRC进行对比,相同则解压成功,不同则密码错误。

异或运算的加入使得算法更加复杂,并且需要同时破解两种算法才能解密文件。要想实现“秒破加密RAR”,只有同时破解了两种密钥文件的加密算法,你才能实现对文件的破解。要不然,光靠暴力破解,只有天河二号超级计算机才能实现“秒破”吧。

而.zip就不一样了。有一种破解方法被称作Known plaintext attack(文本攻击),只要拥有在压缩包中存在的其中任意一个文件件进行同样算法的无加密压缩,然后对比两个压缩包中相同文件,得出差异值获取这个加密包的三个Key,压缩包中的每个文件都是通过这三个Key进行加密压缩的,只要得到了这三个Key就能解压整个加密的压缩包。我认为这是一个漏洞,貌似只有zip存在这样的漏洞,因为该方法只对zip文件奏效。相对而言rar就安全得多,因为二者的加密算法不同。

这就是我为什么推荐.rar的文件压缩了。当然,我想百度还不会闲的没事、拿自己服务器去破解压缩文件,这个世界上,几乎人人都在为各自的利益而奋斗。

『3,防止文件被百度云屏蔽的有效方法』

刚才说了那么多,其实我想说,经过加密的压缩包,网盘客户端会计算出与源文件不同的“特征码”。网盘没有找到与之匹配的“特征码”,就要上传这个文件。因为文件的“特征码”独一无二,所以除非遭到举报(发布外链时),否则这个加密的和谐文件就可以安心地存在云存储上了!

当然,压缩包的名字也是有讲究的。文件名加了密,百度云就不知道你的压缩包真实内容是什么,只能凭借压缩包的文件名来判断。压缩包的名最好不要用文件的原名(因为带名字的原文件已经彻底被加密,安全得到充分保障),同时,非常不建议大家用和中共有关的名词,像“十一届三中全会”“践行科学发展观”,等等。为什么别人那么提倡把文件名改成这些,而我却不这样做?记住,在中华人民共和国,政治永远是敏感的话题。当然你觉得“改成这些内容我放心”,那就随你吧。归根结底最好改成像“小米公司历年发布会视频合集”“托福历年真题2001-2011”这些看上去很正常的文件。

但是,加密压缩包作为最保险最安全的方法同时可能也失去了方便与快捷。比如解密压缩文件可能需要不短的时间。

下面总结一下更多防止百度云屏蔽文件的方法。

4,总结网上流传关于防止百度云屏蔽文件的更多方法

第一种,曾经是大家最常用的方法,就是给文件改名。改名的原则如上。但是,随着百度云屏蔽文件的规则更新,这一招貌似已经失去了作用。

第二种,重新压制视频。比较简单,会让视频有一个新的“特征码”。但是我不知道百度是否具备OCR(光学字符识别)模块或者类似的功能。如果配备,则百度照样可以通过该模块判断你的内容属于非法内容,继而再次屏蔽。这个方法治标不治本。

第三种,转换视频格式,同样比较简单,但结果同上。

第四种,修改文件后缀。事实证明这种方法只是自欺欺人。文件的“特征码”根本没有发生任何变化。

【结论:压缩成.rar、.7z压缩包并连文件名一起加密,设置中文的密码,密码8位数以上,文件名使用学习资料、工程文件之类的。预防措施到位了一切好说,如果只是涉及敏感无法下载,可改名改格式。】

  • 版权声明:本站文章,于 2019年11月24日 4:20 下午,由作者发表。
  • 转载请注明: » 论百度云屏蔽资源原理和如何反屏蔽资源
  • 4 条回复 A 作者 M 管理员
    1. 补充一点,千万不要使用百度云在线解压,把特征码暴露出来被和谐就指日可待了

      • 那文件被分享完了咋办

    2. 那咋解压

    3. 我都是百度云下载完用Za解压,应该ok吧?

    欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论