有哪些的数据获取方式
1、网站日志文件:是做原始的数据获取方式,主要在服务端完成,在网站的应用服务器配置相应的写日志的功能就能实现。
优势:完整的服务端请求记录,包括爬虫等的请求;
缺陷:(1)、日志的获取和清洗过滤成本较高;(2)、无用日志对统计干扰造成数据不准确;(3)灵活性有限(页面端很多操作无法记录)。
2、Web Beacons:实现方式是在需要统计的网站页面或者模块上嵌入一个11像素的透明,用户完全察觉不到,当用户访问该网友的同时会请求透明,并完成页面访问的记录工作,就像是在纸上画一个不易察觉的小点来标记那张纸。它实现了日志记录服务器与网站应用服务器的分离。
优势:(1)、日志服务器与应用服务器分离;(2)、数据获取的可控性使日志处理成本降低。
缺陷:(1)、需要在页面植入小;(2)、获取信息比较有限;(3)、无法获取蜘蛛等不请求的访问记录。
3、JS页面标记:是Web Beacons的改进,是在页面端嵌入JS标记代码,当用户访问网页时同时执行JS代码,JS代码会将一些统计需要的信息以URL参数的形式附带在请求地址的后面,然后再向服务器请求,这样日志服务器就可以获取比较完整的访问数据啦。
优势:(1)、数据获取的可控性和灵活性较高;(2)、可以对页面端操作进行记录;(3)、获取的数据比较完整丰富。
缺陷:(1)、需要在页面植入JS标记代码;(2)、当用户禁用JS功能时无法获取数据;(3)、无法获取蜘蛛等不请求JS的访问记录。
通过 JSONObject类就可以了
首先 你把这几个包 下下来 放到你项目。如果有就不要下了:
1commons-langjar
2commons-beanutilsjar
3commons-collectionsjar
4commons-loggingjar
5ezmorphjar
6json-lib-222-jdk15jar
像你这种是数据形式 就通过 JSONArray 如:
JSONArray datasJson = JSONArrayfromObject(datas);最好把datas toString 一下
0条评论