如何用JAVA实现一个代理服务器

如何用JAVA实现一个代理服务器,第1张

代理服务器的应用非常广泛。比如,在企业网内部,它可以用来控制员工在工作时浏览的Internet内容,阻止员工访问某些类型的内容或某些指定的网站。代理服务器实际上扮演着浏览器和Web服务器之间的中间人的角色,能够对浏览器请求进行各种各样的处理,能够过滤广告和Cookie,能够预先提取Web页面,使得浏览器访问页面的速度更快,等等。

一、基础知识

不管以哪种方式应用代理服务器,其监控HTTP传输的过程总是如下:

步骤一:内部的浏览器发送请求给代理服务器。请求的第一行包含了目标URL。

步骤二:代理服务器读取该URL,并把请求转发给合适的目标服务器。

步骤三:代理服务器接收来自Internet目标机器的应答,把应答转发给合适的内部浏览器。

例如,假设有一个企业的雇员试图访问wwwcnibmcom网站。如果没有代理服务器,雇员的浏览器打开的Socket通向运行这个网站的Web服务器,从Web服务器返回的数据也直接传递给雇员的浏览器。如果浏览器被配置成使用代理服务器,则请求首先到达代理服务器;随后,代理服务器从请求的第一行提取目标URL,打开一个通向wwwcnibmcom的Socket。当wwwcnibmcom返回应答时,代理服务器把应答转发给雇员的浏览器。

当然,代理服务器并非只适用于企业环境。作为一个开发者,拥有一个自己的代理服务器是一件很不错的事情。例如,我们可以用代理服务器来分析浏览器和Web服务器的交互过程。测试和解决Web应用中存在的问题时,这种功能是很有用的。我们甚至还可以同时使用多个代理服务器(大多数代理服务器允许多个服务器链接在一起使用)。例如,我们可以有一个企业的代理服务器,再加上一个用java编写的代理服务器,用来调试应用程序。但应该注意的是,代理服务器链上的每一个服务器都会对性能产生一定的影响。

二、设计规划

正如其名字所示,代理服务器只不过是一种特殊的服务器。和大多数服务器一样,如果要处理多个请求,代理服务器应该使用线程。下面是一个代理服务器的基本规划:

等待来自客户(Web浏览器)的请求。

启动一个新的线程,以处理客户连接请求。

读取浏览器请求的第一行(该行内容包含了请求的目标URL)。

分析请求的第一行内容,得到目标服务器的名字和端口。

打开一个通向目标服务器(或下一个代理服务器,如合适的话)的Socket。

把请求的第一行发送到输出Socket。

把请求的剩余部分发送到输出Socket。

把目标Web服务器返回的数据发送给发出请求的浏览器。

当然,如果考虑细节的话,情况会更复杂一些。实际上,这里主要有两个问题要考虑:第一,从Socket按行读取数据最适合进一步处理,但这会产生性能瓶颈;第二,两个Socket之间的连接必需高效。有几种方法可以实现这两个目标,但每一种方法都有各自的代价。例如,如果要在数据进入的时候进行过滤,这些数据最好按行读取;然而,大多数时候,当数据到达代理服务器时,立即把它转发出去更适合高效这一要求。另外,数据的发送和接收也可以使用多个独立的线程,但大量地创建和拆除线程也会带来性能问题。因此,对于每一个请求,我们将用一个线程处理数据的接收和发送,同时在数据到达代理服务器时,尽可能快速地把它转发出去。

三、实例

在用java编写这个代理服务器的过程中,注意可重用性是很重要的。因为这样的话,当我们想要在另一个工程中以不同的方式处理浏览器请求时,可以方便地重用该代理服务器。当然,我们必须注意灵活性和效率之间的平衡。

图一显示了本文代理服务器实例(HttpProxyjava)的输出界面,当浏览器访问http://www-900ibmcom/cn/时,代理服务器向默认日志设备(即标准输出设备屏幕)输出浏览器请求的URL。图二显示了SubHttpProxy的输出。SubHttpProxy是HttpProxy的一个简单扩展。

图一

图二

为了构造代理服务器,我从Thread基类派生出了HttpProxy类(文章正文中出现的代码是该类的一些片断,完整的代码请从本文最后下载)。HttpProxy类包含了一些用来定制代理服务器行为的属性,参见Listing 1和表一。

Listing 1

/

一个基础的代理服务器类

/

import javanet;

import javaio;

public class HttpProxy extends Thread {

static public int CONNECT_RETRIES=5;

static public int CONNECT_PAUSE=5;

static public int TIME-OUT=50;

static public int BUFSIZ=1024;

static public boolean logging = false;

static public OutputStream log=null;

// 传入数据用的Socket

protected Socket socket;

// 上级代理服务器,可选

static private String parent=null;

static private int parentPort=-1;

static public void setParentProxy(String name, int pport) {

parent=name;

parentPort=pport;

}

// 在给定Socket上创建一个代理线程。

public HttpProxy(Socket s) { socket=s; start(); }

public void writeLog(int c, boolean browser) throws IOException {

logwrite(c);

}

public void writeLog(byte[] bytes,int offset,

int len, boolean browser) throws IOException {

for (int i=0;i<len;i++) writeLog((int)bytes[offset+i],browser);

}

// 默认情况下,日志信息输出到

// 标准输出设备,

// 派生类可以覆盖它

public String processHostName(String url, String host, int port, Socket sock) {

javatextDateFormat cal=javatextDateFormatgetDateTimeInstance();

Systemoutprintln(calformat(new javautilDate()) + " - " +

url + " " + sockgetInetAddress()+"<BR>");

return host;

}

表一

变量/方法 说明

CONNECT_RETRIES 在放弃之前尝试连接远程主机的次数。

CONNECT_PAUSE 在两次连接尝试之间的暂停时间。

TIME-OUT 等待Socket输入的等待时间。

BUFSIZ Socket输入的缓冲大小。

logging 是否要求代理服务器在日志中记录所有已传输的数据(true表示“是”)。

log 一个OutputStream对象,默认日志例程将向该OutputStream对象输出日志信息。

setParentProxy 用来把一个代理服务器链接到另一个代理服务器(需要指定另一个服务器的名称和端口)。

当代理服务器连接到Web服务器之后,我用一个简单的循环在两个Socket之间传递数据。这里可能出现一个问题,即如果没有可操作的数据,调用read方法可能导致程序阻塞,从而挂起程序。为防止出现这个问题,我用setSoTimeout方法设置了Socket的超时时间(参见Listing 2)。这样,如果某个Socket不可用,另一个仍旧有机会进行处理,我不必创建一个新的线程。

Listing 2

// 执行操作的线程

public void run() {

String line;

String host;

int port=80;

Socket outbound=null;

try {

socketsetSoTimeout(TIMEOUT);

InputStream is=socketgetInputStream();

OutputStream os=null;

try {

// 获取请求行的内容

line="";

host="";

int state=0;

boolean space;

while (true) {

int c=isread();

if (c==-1) break;

if (logging) writeLog(c,true);

space=CharacterisWhitespace((char)c);

switch (state) {

case 0:

if (space) continue;

state=1;

case 1:

if (space) {

state=2;

continue;

}

line=line+(char)c;

break;

case 2:

if (space) continue; // 跳过多个空白字符

state=3;

case 3:

if (space) {

state=4;

// 只分析主机名称部分

String host0=host;

int n;

n=hostindexOf("//");

if (n!=-1) host=hostsubstring(n+2);

n=hostindexOf('/');

if (n!=-1) host=hostsubstring(0,n);

// 分析可能存在的端口号

n=hostindexOf(":");

if (n!=-1) {

port=IntegerparseInt(hostsubstring(n+1));

host=hostsubstring(0,n);

}

host=processHostName(host0,host,port,socket);

if (parent!=null) {

host=parent;

port=parentPort;

}

int retry=CONNECT_RETRIES;

while (retry--!=0) {

try {

outbound=new Socket(host,port);

break;

} catch (Exception e) { }

// 等待

Threadsleep(CONNECT_PAUSE);

}

if (outbound==null) break;

outboundsetSoTimeout(TIMEOUT);

os=outboundgetOutputStream();

oswrite(linegetBytes());

oswrite(' ');

oswrite(host0getBytes());

oswrite(' ');

pipe(is,outboundgetInputStream(),os,socketgetOutputStream());

break;

}

host=host+(char)c;

break;

}

}

}

catch (IOException e) { }

} catch (Exception e) { }

finally {

try { socketclose();} catch (Exception e1) {}

try { outboundclose();} catch (Exception e2) {}

}

}

和所有线程对象一样,HttpProxy类的主要工作在run方法内完成(见Listing 2)。run方法实现了一个简单的状态机,从Web浏览器每次一个读取字符,持续这个过程直至有足够的信息找出目标Web服务器。然后,run打开一个通向该Web服务器的Socket(如果有多个代理服务器被链接在一起,则run方法打开一个通向链里面下一个代理服务器的Socket)。打开Socket之后,run先把部分的请求写入Socket,然后调用pipe方法。pipe方法直接在两个Socket之间以最快的速度执行读写操作。

如果数据规模很大,另外创建一个线程可能具有更高的效率;然而,当数据规模较小时,创建新线程所需要的开销会抵消它带来的好处。

Listing 3显示了一个很简单的main方法,可以用来测试HttpProxy类。大部分的工作由一个静态的startProxy方法完成(见Listing 4)。这个方法用到了一种特殊的技术,允许一个静态成员创建HttpProxy类(或HttpProxy类的子类)的实例。它的基本思想是:把一个Class对象传递给startProxy类;然后,startProxy方法利用映像API(Reflection API)和getDeclaredConstructor方法确定该Class对象的哪一个构造函数接受一个Socket参数;最后,startProxy方法调用newInstance方法创建该Class对象。

Listing 3

// 测试用的简单main方法

static public void main(String args[]) {

Systemoutprintln("在端口808启动代理服务器\n");

HttpProxylog=Systemout;

HttpProxylogging=false;

HttpProxystartProxy(808,HttpProxyclass);

}

}

Listing 4

static public void startProxy(int port,Class clobj) {

ServerSocket ssock;

Socket sock;

try {

ssock=new ServerSocket(port);

while (true) {

Class [] sarg = new Class[1];

Object [] arg= new Object[1];

sarg[0]=Socketclass;

try {

javalangreflectConstructor cons = clobjgetDeclaredConstructor(sarg);

arg[0]=ssockaccept();

consnewInstance(arg); // 创建HttpProxy或其派生类的实例

} catch (Exception e) {

Socket esock = (Socket)arg[0];

try { esockclose(); } catch (Exception ec) {}

}

}

} catch (IOException e) {

}

}

利用这种技术,我们可以在不创建startProxy方法定制版本的情况下,扩展HttpProxy类。要得到给定类的Class对象,只需在正常的名字后面加上class(如果有某个对象的一个实例,则代之以调用getClass方法)。由于我们把Class对象传递给了startProxy方法,所以创建HttpProxy的派生类时,就不必再特意去修改startProxy。(下载代码中包含了一个派生得到的简单代理服务器)。

结束语

利用派生类定制或调整代理服务器的行为有两种途径:修改主机的名字,或者捕获所有通过代理服务器的数据。processHostName方法允许代理服务器分析和修改主机名字。如果启用了日志记录,代理服务器为每一个通过服务器的字符调用writeLog方法。如何处理这些信息完全由我们自己决定——可以把它写入日志文件,可以把它输出到控制台,或进行任何其他满足我们要求的处理。writeLog输出中的一个Boolean标记指示出数据是来自浏览器还是Web主机。

和许多工具一样,代理服务器本身并不存在好或者坏的问题,关键在于如何使用它们。代理服务器可能被用于侵犯隐私,但也可以阻隔偷窥者和保护网络。即使代理服务器和浏览器不在同一台机器上,我也乐意把代理服务器看成是一种扩展浏览器功能的途径。例如,在把数据发送给浏览器之前,可以用代理服务器压缩数据;未来的代理服务器甚至还可能把页面从一种语言翻译成另一种语言……可能性永无止境。

用HttpClient(commonshttpclient)包,模拟一个Get请求,发送到网址1721630230/文件地址。这个文件地址不能是E/Map/123txt,必须是暴露在服务器中的应用里的。就像你写的应用里的一个jsp页面的目录。

成功发送get请求后,就会得到response,里面有流。就是你下载的文件,然后可以通过FileOutputStream,指定你输出目录,写到磁盘上。

Java游戏开发要学什么?所谓的游戏开发编程语言其实有很多,基本上任何一种语言都可以作为游戏服务器的编程语言。这需要根据自己游戏的类型和要求加以选择。比如C++,Java,Erlang,go等等。目前我用过的只有C++和Java但是以Java为主。所以接下来就以自己的经验,谈谈以Java为核心的游戏服务器开发技术体系。

Java目前作为游戏服务器开发语言已经很是普遍。但是大多数是作为页游或手游的服务器,而端游戏一般选择C++,因为端游对服务器的性能要求相对比较高一些。两种语言各有利弊。C++效率高,但是掌握度难些。没有Java易于掌握。而目前对于追求快速上线率的页游和手游来说,Java成了一个不错的选择。

一、Java的技术系统

需要学习的技术:

(1)Java基础知识

(2)JavaNIO编程

(3)Netty,Mina网络框架精通一种,其它作为了解。

(4)一种缓存框架:Redis;memcache熟悉使用一个。

(5)SQL语言,用于数据库:mysql数据库

(6)springmvc主要用于http协议的服务器

(7)多线程编程,明白线程安全的重要性。

(8)Java并发集合的掌握。

(9)Linux常用的基本命令及shell脚本。

(10)数据库操作,比如mybatis。

以Java为服务器编程语言来说,掌握Java的基本知识就不必说了,是必不可少的。可以参考《Java编程思想》,《Java核心技术》等书。根据游戏通信协议的不同,大致有两种实现方式:Socket和http。先说简单些的http协议,这个协议已经很成熟的应用到了网站上。而Java语言也可以用于网站开发,所以相当就简单些。现在有很多开源的服务器软件,比如:tomcat,resin等。游戏前端不管是页游flash,还是手游的Android,IOS都支持http协议,只要把游戏的逻辑数据按post方法向服务器发出请求即可了。

二、学习流程

当然了,学习这些东西并不是一蹴而就的。需要根据实践循环渐进,这里推荐一个学习流程:

(1)对于初学Java的人来说,如果自学能力好些,可以买些书自己练习,而现在又更的多选择参加Java培训机构,以快速的掌握Java的知识。

(2)掌握了Java知识之后,要多写代码实践。这个时候可以结合mysql学习SQL语言,掌握数据库的操作。比如用springmvc写一个小网站,用mybatis实现网站数据的增,删,改,查等功能。

(3)完成上步之后,可以在服务器程序和数据库之间加一个缓存,学习redis或memcache。

(4)把程序部署到linux服务器上,练习linux的基本命令及shell脚

免责声明:内容来源于公开网络,若涉及侵权联系尽快删除!

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 如何用JAVA实现一个代理服务器

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情