永林蓝豹地板价格表:excel大师。word大师。保存网页的高手,统计的大师,来帮忙吧~

来源:百度文库 编辑:杭州交通信息网 时间:2024/04/29 23:27:02
excel大师。word大师。保存网页的高手,统计的大师,来帮忙吧~

这个是帮朋友发的:因为我告诉他winzheng上面高人很多。
(以第一人称发的帖子,其实主人公不是我)

我是一个研究网络语言的博士生。我为此在各个论坛搜集了1000多个网页。。。。

其中一个任务是 我要统计这里面一个有多少个图标和图片。

有问题如下:

1,怎么把这1000多个网页批处理成word文档?

注意: 1,不是txt文档,因为,保存为txt文档,图标和图片就丢失了。
2,我已经把这1000多个网页保存下来了。。当时,是“另存为” “网页,仅html”。。。

2,我改怎么统计有多少图标和图片?

注意:1,可以不考虑图标和图片的具体内容,比如:哭的图标和笑的图标认为是一个东西也可以的

2,如果可以统计有多少哭的图标,多少笑的图标,多少。。。那就更好啦!!

3,关于第二个问题,我的初步想法:

方案一:把网页保存到word之后,把图标代换掉,比如代换成一个极少用的符号,然后,搜寻有多少个这样的符号。

方案二:把网页保存为excel,然后,把所有的文字,图标,图片分别存到格子里面,注意:一个格子只放一个文字或者图标。。。。然后,排序,就可以了。

方案二,有很多好处,我可以非常明白的了解网络语言中,网民对语言的使用情况,但是,怎么把网页存到excel呢?是不是要从word再批处理为excel呢?保存进去以后,又怎么把文字和图标分别放到每一个格子呢?

我时间很紧张。。。。收集网页,收集网络新闻的标题,收集呢称。。。。再一句一句的分析。。。。我注重的是使用语言的情况,比如有多少动词,语气词,。。。。对发布的内容不感兴趣。。。

请求高手帮忙!

这个题目很有意思!

统计1000个网页有多少个图标和图片,本人觉得不用再转换为WORD文档。
可以看出出问题的人很聪明(可能是专门搞研究的缘故吧),不过计算机语言可能没到信手拈来的程度。

二楼的办法是可以,但与提问的人初衷不一样,效率太低,且没考虑同一个图片正好同时被两个调用的情况、一个图片被同一个网页调用两次的情况(不知这算两次还是一次,按我的理解应该算两次)。

本人觉得最好的办法是编写一个小程序,采用循环方式直接读取网页HTML源代码,统计网页中图片标签IMG出现的次数就可以了。这个办法也不一定要专业的程序员,随便懂一点计算机语言的人就可以了。一般过二级考试的C、VB甚至VF都可以搞定的。

实在不行用楼主的办法也行,先将网页以纯文本形式打开,粘贴到WORD中,然后采用查找替换将图标标签IMG替换为某一特定字符串(IMG为单标签,查找替换时最好采用通配符),选定后以特定字符串为定界符,转换为表格(此时肯定只有一行多列),将表格中不属于图片标签的列删除,然后“表格转换为文字”、“文字转换为表格”多执行几次...再粘贴到EXCEL中

重复上述步骤搞完1000个文件,EXCEL里面就有结果了。

麻烦你再把1000个网页另存为,网页,全部,这样多出1000个目录里面都是你想要的图片和图标,剩下的时间,呵呵,慢慢数吧。

无法回答