2010年11月9日星期二

"和谐糊椒面"翻墙技术构想

前言
      子曰:"和谐就像糊椒面, 哪里需要洒一点"。
     您所访问的网页为何打不开,是因为祖国母亲认为它不和谐。那可不可以把和谐像糊椒面一样洒到那些不和谐的网页里面,从而通过祖国母亲的审核呢?
     本文将阐述将“和谐”像糊椒面一样洒到不和谐网页里的翻墙软件技术构想。希望可以起到抛砖引玉的效果,并最终达成"各位网友齐动手,一起达到和谐社会主义建设新高潮"的生动局面。



序论
     GFW除了屏蔽网址外,还对某些网站执行HTTP报文内容的敏感词过滤。本文即探讨一种通过向敏感词里洒入和谐词从而避过GFW HTTP内容过滤的方法。



概念
  • 敏感词:一份不断更新的,目前至少包括上万词语的列表。包括汉字和英文,繁体和简体。
  • 和谐词:例如“和谐”,“大米”,“花生”,“中华人民共和国”这种不包括任何敏感词组成汉字的词汇。



正文
     代理技术是本设想的基础。
     令U为墙内用户,L为本地代理,T为要访问的已被墙的目的网址,P为在墙外的远程代理服务器。通讯过程如下图所示:
U ---->>  L  ---->>  P  ---->>  T
U <<----  L  <<----  P  <<----  T

     P与L之间的交互,考虑使用WebService实现,因为它天然可以穿越本地防火墙(有些公司或者家庭是有防火墙的),而且P可以实现在普通的网站上,不需要监听除80外的额外端口。即便如此,P与L之间的交互仍可能遭遇GFW基于内容的过滤并被阻断。
     对于此问题,有些人的解决办法可能是使用基于HTTPS的WebService,这样解决的金钱成本较高。本解决方案为:洒点“和谐糊椒面”:
  1. “艾未未” 为敏感词,那么P与L之间传输此词时就会被GFW发现并阻断。  
  2. 令L和P之间约定 “糊椒面” 为和谐词,那么双方将“艾未未”三字传输给对方之前,把它变为“艾糊椒面未糊椒面未”再行传输,由接收端除去和谐词“糊椒面”。这样一来GFW就很难通过内容过滤发现敏感词了。


优势
     本设想相比与其它的翻墙软件架构有如下优势:
  • 1 WebService技术自动穿越本地防火墙。 
  • 2 P可以在普通webServer上实现,不需要额外监听除80之外的额外端口,不需要HTTPS,成本低,易实现。 
  • 3 “和谐词”可由用户U自行设置,千变万化足以让妄图监听的GFW抓狂。


劣势
     HTTPS地址的问题暂未想出解决办法。
     例如twitter登录过程中会跳转经过一段https的网址,而本方案又不支持HTTPS从而无法登录成功,只可以直接访问www.twitter.com/aiww 看到他们所说的话,无法登录发言。

     实现本构想的软件本人已实现,可通过它成功使用google等网站。希望本设想可以激发其它网友的奇思妙想,发动一场翻墙技术上的劳动竞赛,但要记住“和谐第一,比赛第二”哦!~

by harmonious pepper

twitter  @harmpepper