分享一种高速有效的CD/书籍纠错方法

陈永仁

2008-02-18 23:02:15 来自: 陈永仁

本文内amazon指代不包含中国卓越内的amazon网站

douban其实是能直接导入amazon资料的,关联之后我们点购买link可以查到cd信息。

但是很多条目没有跟amazon关联上,这样很多错误我们查不到。

那怎么办呢?就是我们自己来抓

首先进入amazon网站,找到一张CD

找到ASIN一栏目,记录下“ASIN码”

然后回豆瓣输入

http:www.douban.com/subject/aXXASIN

其中XX是地区号码,对应你查的amazon网站

us=美国 uk=英国 jp=日本 等等

输入好后回车,如果这个CD已经在douban,那么douban条目将跟amazon关联,并读取信息

如果不存在这样cd,douban自动新建一个条目

很方便对吧!

现在我要说的是如何纠错

我们面对的情况是大面积的条形码错误

ok,用cd的条形码到amazon去搜索,找到条目,用ASIN反加回来,让amazon的信息来纠正错误。

这样比大量的投票要方便多了。

你也可以试一下

缺点:

1)注意日文cd就去日本amazon查,这样抓过来的信息才是日文,而不是英文+罗马音,什么国家的cd就去什么国家的amazon查
2)amazon上没有的cd查不了
3)导入程序是机械的,它不会理解soundtrack不是作者,后面那个才是(这个看amazon上条目会清楚),可能会有抓取错误,我们争取通知douban team改进
4)只能抓CD\book,如果谁知道怎么抓DVD也请告诉我

ok,以上

  • 板儿砖™

    2008-02-19 02:22:19 板儿砖™ (其实时间是不存在的—__—)

    豆瓣就是这样顺道抓取amazon数据的...

  • Taumini™

    2008-02-19 09:39:23 Taumini™ (沒有一條路能讓所有人都得到幸福)

    book就是直接通过isbn抓的,DVD貌似是不支持的。

  • 陈永仁

    2008-02-19 09:54:34 陈永仁

    2008-02-19 09:39:23 Taumini™游乐场 (上海)  book就是直接通过isbn抓的,DVD貌似是不支持的。

    如何抓 subject/a+地区+isbn号码?

  • 陈永仁

    2008-02-19 09:58:24 陈永仁

    测试成功 subject/a+地区+10位isbn号码

  • 陈永仁

    2008-02-19 10:12:48 陈永仁

    还存在的问题是,信息抓过来了,但是购买链接没上去,这是bug吗?

  • joere

    2008-02-19 10:13:36 joere (我要私人飞机!)

    牛!

  • 板儿砖™

    2008-02-19 23:57:55 板儿砖™ (其实时间是不存在的—__—)

    有分帐协议的是amazon.cn...

  • lcn

    2008-03-07 22:48:10 lcn (时间就像海绵中的水,挤挤就没…)

    可惜台版书貌似就不能这么弄了……(叹气)

  • givoLtaqe

    2008-05-25 01:01:05 givoLtaqe (I am possessed.)

    amazon只有ASIN,没提供EAN/UPC,是怎么做到关联的呢?

  • lcn

    2008-05-29 11:42:27 lcn (时间就像海绵中的水,挤挤就没…)

    EAN/UPC是算出来的吧……

  • ▇▇▇▇▇▇

    2009-01-06 17:46:03 ▇▇▇▇▇▇ (▇ ▇▇ ▇ ▇ ▇▇ ▇▇▇)

    我想
    条码是AMAZON内部关联好的,抓数据的时候有接口可以抓过来


这个小组的纠察队员也喜欢去   · · · · · · 

-豆瓣待添加帮助-
-豆瓣待添加帮助- (221)
豆瓣条目添加狂
豆瓣条目添加狂 (47)
幼儿园的时候别个小手帕
幼儿园的时候别个小手帕 (279)
爆米花
爆米花 (42)
世界末日前要記得去噓噓哦
世界末日前要記得去噓噓哦 (71)
红蜻蜓
红蜻蜓 (37)

> 回豆瓣纠错小组


最新话题:

请投封面   (陈永仁)

【done】请投封面   (mgrex)

[done]请投剧情简介   (Tigawjw)