宝贝回家论坛

 找回密码
 注册
搜索
查看: 9764|回复: 18

[操作教程] 抛砖引玉班门弄斧之:谈谈利用搜索引擎

   关闭 [复制链接]
北方多文天王 发表于 2010-6-12 12:55 | 显示全部楼层 |阅读模式
本帖最后由 气质の羊羊 于 2010-6-12 20:40 编辑

抛砖引玉班门弄斧之:谈谈利用搜索引擎

   
     (下略自谦的话3000字)


【实例】一    强制匹配符: " " 就是英文的引号,中间引起来的部分,强制完全对应。

        例如,我们想搜一个失踪儿童的信息,他应该是在云南一个叫做木厂镇老王寨的地方

        我们想知道该地村委会的电话号码

        如果我直接搜索,键入 木厂镇老王寨村委会电话

        Google会找到一些不是那么急需的网站,例如


木厂镇是一个多民族聚居的边境镇,少数民族人口占全镇总人口的62.8%。布依族主要分布在杨茂松、底麻、大坝、湖广寨、老王寨等村委会,是文山州布依族主要集中聚居的 ...

木厂镇_百度百科
木厂镇是一个多民族聚居的边境镇,少数民族人口占全镇总人口的62.8%。布依族主要分布在杨茂松、底麻、大坝、湖广寨、老王寨等村委会,是文山州布依族主要集中聚居的 ...

        如果我们强制匹配,搜索

        "木厂镇老王寨"  "村委" "电话"

        很快就能在第五个结果发现

       马关县木厂镇老王寨村委会
       村支书:xxx 联系电话:xxxxxxxxxxx.

        改进一下

       搜索  "木厂镇老王寨"  "村支书" "电话"

       第一个就找到了。


       【实例2】 “+” , "-" ,“OR”  (加,减和或)

         例如,我想查找关于端午祭的消息,但是不希望出现韩国的“端午祭”

         如果直接用Google搜索,铺天盖地都是韩国的事情,所以

         搜索  端午祭 -韩国
      
         就得到所有包含端午祭,而不包含韩国的网页了。

         再举一例,如果我想搜索流浪儿童救助事宜,而不想得到结果包含"民政"的网页

         搜索  流浪儿童 救助 -民政
         
         就可以了。

         在这个例子中,空格就是“+”,为了方便,Google允许你用空格代替省略了。

         流浪儿童 救助 -民政

         意思是:所有包含“流浪儿童” “救助”但不包含“民政”的网页。

         
         OR 的意思是或者

         例如,我想搜索一条信息,关于某个江苏走失儿童的,但是不清楚是91年走失,还是92年

         所以我们敲入

         江苏 走失  1991年 OR 1992年 OR 91年 OR 92年

         这个例子里,既写入“1991年”的形式,也写了个“91年”,是因为有的网页会用“91年”代替正规的“1991年”

         (未完,待续)
为了保证您发布的信息能够及时的得到回复及关注
建议您登陆后进行发帖操作.请点击这里
登陆注册
风信子 发表于 2010-6-12 20:52 | 显示全部楼层
这个要学习一下。
小禾 发表于 2010-6-12 21:11 | 显示全部楼层
真长知识了!佩服!
大堆 发表于 2010-6-13 00:46 | 显示全部楼层
佩服佩服,这个方式我还是第一次听说呢,期待更多更好的方法,谢谢楼主。

另,回复前试验了一下,用的百度。

第一个方法,就是英文状态的引号强制搜索,似乎没什么效果,搜索结果居然是这篇帖子。

第二个方法,就是用减号的那个,在百度上也很有效果哦。
匿名  发表于 2010-6-13 01:33
这个办法好,明天我到群里去推广,希望其他志愿者也提供各自搜索的心得,使我们的工作越来越有成效。
匿名  发表于 2010-6-13 10:24
佩服佩服,这个方式我还是第一次听说呢,期待更多更好的方法,谢谢楼主。

另,回复前试验了一下,用的百 ...
大堆 发表于 2010-6-13 00:46



    因为Google对刚刚出现的新网页有奖励,他认为这是新资讯。

     百度有很多时候是没法用的,搜中文应该还凑合,但是我没怎么用过百度,所以也没发言权。

     Google现在的大问题是被GFW了,要求所有人都翻墙也不现实,而被墙的Google,很多姓氏根本不能出现,对寻人很不利。

    例如胡萝卜,李白,温度,习惯,这些词不翻墙都不能查,一查就当掉。

   所以你不翻墙就用百度吧,大体上是一样的。我记得百度最初的语法都是山寨Google的。
匿名  发表于 2010-6-13 10:40

群策群力,完善一个自定义专门搜索失踪人口的引擎

首先说明下,Google自定义搜索就是可以利用Google对某些特定网站、网页进行搜索

         这样有两个好处,一个是能够通过增减网站,让我们的搜索更加有针对性;

       第二个好处是因为我们增加的都是国内的“好”网站,Google不会被被墙掉,甚至可以搜索胡萝卜之类的词

     这是我做的一个自定义

http://www.google.com/cse/home?c ... zou4na&hl=zh-cn

      目前对以下16个网站网页中的内容进行搜索

tuxiang.jpg

     可以看到,除了宝贝回家,就是新浪博客,百度贴吧,剩下的都是我找到的一些专业寻人网站。

      这显然是不够的,所以需要大家提供建议,还有哪些网站对寻人帮助特别大,例如寻人网。

    另外就是同义词的问题了。

   我自定义的词是 走失, 这个词的近义词我选择了:拐,拐骗,丢失,走丢,被拐,被坏人...

     也就是如果搜: 孩子 走失  山西   

      那么 孩子在山西被拐(被拐骗,走丢,被坏人...) 也认为命中。

    tongyici.jpg
     还可以继续添加同义词,减少工作量
   
     请大家群策群力,多多想办法!

点评

这个很好,好好研究下  发表于 2010-6-22 00:11
蓝色天空 发表于 2010-6-13 12:25 | 显示全部楼层
这个一定要学习下,到时候能用上
梦里乐 发表于 2010-6-13 12:35 | 显示全部楼层
厉害厉害,好多 都头一次听说
袁朝晖 该用户已被删除
袁朝晖 发表于 2010-6-13 12:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 北方多文天王 发表于 2010-6-13 12:52 | 显示全部楼层
【实例】   选好关键词

               例如我开了个饭馆,可能有外国客人,那我想要把菜单上的“宫保鸡丁”翻译成英文

  
               直接搜“宫保鸡丁”“英文” “怎么说” 之类的,当然也可以得到结果

               但是不如直接搜 "宫保鸡丁" "chicken" ,因为我估计,出现我要的结果的网页,一定既包含宫保鸡丁,也包含chicken。

               结果是:

               中英文菜单译本“出炉” 宫保鸡丁为Kung Pao Chicken_时政频道_新华网 -

               我认为这个结果已经足够权威了。


               类似的,前几天我在别的网站看到一条寻人信息(小邱),我想知道咱们网站有没有,就找了“86年生” “91年” “丢”
               这几个词,结果找到一条,叫曾昆,感觉很像!(进一步向志愿者前辈小土求助,发现双方的DNA都入库了,应该不是)

               91年,就是必定会在各个信息里都出现的Chicken.



       【实例】 site 命令

                这是个非常有用的命令

                格式是:  要找的词 site:www.xxx.xxx  也就是site: 后边跟着网站,意思是:只在这个网站里找。

                例如直接找“曾昆”,网络上有无数的信息,绝大部分是没用的。

                如果想在宝贝回家里找,就敲

                曾昆   site: www.baobeihuijia.com

                这样所有结果都是在宝贝回家里的。

                如果有很多想要找的网站,就可以自建一个自定义搜索引擎了

点评

要找的人名字和网站名称中间需要空格吗?  发表于 2010-6-13 13:38
 楼主| 北方多文天王 发表于 2010-6-13 13:05 | 显示全部楼层
图片搜索
    这大概是最困难的了。

    在Google  image 搜索目前只支持文字描述

    不支持给图搜图的搜索

    不过也可能有线索

    我在Google图片搜索里键入  厦门 乞讨

    有不少厦门附近的乞讨儿童照片,都是好心网友拍摄后上传到互联网的

     对于丢失儿童的母亲来说,任何一张照片都是宝贵的

    www.tineye.com  这个网站支持从图到图的搜索!!!

     但是很不幸,这个网站几乎不对国内互联网做抓取和检索

     也就是说你要是搜国外网站的图,很方便,国内的,没戏

     我非常期待他们也能抓取国内互联网的图片

   http://labs.ideeinc.com/visual/,这个也是,本来用处不小,但是用China Begger做关键字,只有3张图,因为它也几乎不抓中国互联网内容。

     还有个实在没办法的办法,或许着急的时候能用下

     图片都是有大小的,右键,可以看到类似  334 X  225 这样的大小信息

     实在没办法的时候,用这个"334 X  225 " 做关键字在Image里检索,说不定能碰运气真的找到。
草莓 发表于 2010-6-22 00:09 | 显示全部楼层
感谢楼主奉献,学习了
moradl 发表于 2010-6-22 01:05 | 显示全部楼层
天才!天才!天才!天才!天才!天才!
发表于 2010-6-22 10:52 | 显示全部楼层
好东西,收藏
luo32199 发表于 2010-12-29 12:56 | 显示全部楼层
小细节、大成就。
广东寻觅 发表于 2011-9-26 09:17 | 显示全部楼层
这个办法好,玩了多年电脑,现在才知道。要加强学习了。
曲阜老牛 发表于 2011-9-26 10:09 | 显示全部楼层
好东西,学习了,感谢楼主
淡嘫①笶 该用户已被删除
淡嘫①笶 发表于 2012-3-4 20:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|宝贝回家志愿者协会 ( 吉ICP备08101543号 )

GMT+8, 2024-11-27 08:38 , Processed in 0.041283 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表