『漫游』酷论坛>『动漫主题讨论区』>漫画下载交流区>[转贴]转个163相册下载 ..

tgl10@2006-04-27 01:01

我也不是做完全的浏览器,没那精力。。这mshtml库有太多类了,而且似乎还是个过时的库==||,好象用XML2的比较多,刚接触,还不清楚

只想完成几个功能,其中有个是自动浏览功能,因为很多网站的源码分析不透,没法提到图片网址,就想用浏览器的缓冲目录收集这些图片

OX163也是个简易的浏览器吧
引用

xz^_^xz@2006-04-27 01:09

httpwatch 分析所有网页数据。

只要是有的,都可以看到
引用

tgl10@2006-04-27 01:15

引用
最初由 xz^_^xz 发布
httpwatch 分析所有网页数据。

只要是有的,都可以看到
这个在什么库里?叫什么dll
引用

tgl10@2006-04-27 01:22

搜了一下,是别人开发的软件?
Maxthon的viewsource插件也可以看到有时源码看不到的图片地址
不过这些地址未必有规律,没法批量下载
引用

xz^_^xz@2006-04-27 01:24

httpwatch是分析所有浏览器传输数据

只要是传进传出的,都会截取,包括协议,cookie,post的数据等等。

然后分析就好了。

是个很好用的插件。类似的插件还有很多,不过感觉这个最好。
引用

tgl10@2006-04-27 01:35

引用
最初由 xz^_^xz 发布
httpwatch是分析所有浏览器传输数据

只要是传进传出的,都会截取,包括协议,cookie,post的数据等等。

然后分析就好了。

是个很好用的插件。类似的插件还有很多,不过感觉这个最好。
对了,问你个问题,你的那个163下载软件是怎么缓冲的?
下载图片的时候缓冲文件夹是IE默认的,还是软件目录里的download文件夹?
引用

xz^_^xz@2006-04-27 01:36

没有缓冲,直接下到指定文件夹的。和IE一点关系没有

要说缓冲,大概是在内存里吧。

汗,又一个半夜不睡觉的。
引用

tgl10@2006-04-27 01:42

昨天自己搞这个搞了一夜,结果整个白天都很不在状态。。
说实话熬夜不好,或者我不适合做程序员;(
引用

xz^_^xz@2006-04-27 01:43

引用
最初由 tgl10 发布
昨天自己搞这个搞了一夜,结果整个白天都很不在状态。。
说实话熬夜不好,或者我不适合做程序员;(


天天熬夜都已经习惯了

昼夜颠倒的说。
引用

tgl10@2006-04-27 01:46

最近在做什么呢?
引用

xz^_^xz@2006-04-27 01:49

引用
最初由 tgl10 发布
最近在做什么呢?


写一些有用的类库

主要是用来分析文本,例如分析网页,分析代码文件

主要是网上没有多少这样的代码

只有自己写了

一般的文本处理方法,无非是正则式提取

要么就是N个循环来分析,通用性很差

据说google最核心之一的就是网页分析,崇拜啊,崇拜。
引用

tgl10@2006-04-27 02:01

这个正则式 的概念一直没有搞懂的说
做出来后做成插件发布吧

对了,百鬼有12没有?
知道你也爱这个;)
引用

xz^_^xz@2006-04-27 02:04

日文的倒是有,估计你也知道。

中文的整卷没看到,但是好像有了一些不是单行本的翻译。
引用

takabe@2006-04-27 11:18

引用
最初由 tgl10 发布
我也不是做完全的浏览器,没那精力。。这mshtml库有太多类了,而且似乎还是个过时的库==||,好象用XML2的比较多,刚接触,还不清楚

只想完成几个功能,其中有个是自动浏览功能,因为很多网站的源码分析不透,没法提到图片网址,就想用浏览器的缓冲目录收集这些图片

OX163也是个简易的浏览器吧


…………我那个又没有技术含量
你们说的我还听不懂啊……
OX163那个浏览器,就是IE呀……

楼上,上传快快修复,0.37大概就我一个上传成功的?
不过,这个星期,上传都不成功了,就一个劲的开文件夹……
引用

Rufus@2006-04-27 18:47

引用
最初由 tgl10 发布
搜了一下,是别人开发的软件?
Maxthon的viewsource插件也可以看到有时源码看不到的图片地址
不过这些地址未必有规律,没法批量下载

也就是所谓的
js也可以动态放上对象的
body.onload里面写函数
这样的动态对象,用查看源文件是看不到的
可以用document.children[0].innerHTML看到
Maxthon的viewsource插件估计用的也是这种方法

这样的动态对象和他们的代码是不能靠简单的源码分析直接得到的
包括各种监听手段

因为问题不在于你拿到数据就有用的
而是要经过浏览器用js函数进行解码之类等才能转化为正常的地址
加密/解码然后动态放上url,这种方法现在在线漫画里面用的还的挺常见的

regular expression...
这个有时候花点时间研究一下也是有用的,不仅是程序里用了
有时候写代码文字,作文档的时候配合UltraEdit用这个作替换,用起来也非常爽快的

ps.其实我那段js代码里面也有一个小小的正则表达式
引用

«123»共3页

| TOP