新近

Δελφοί
来自: Δελφοί (天津) 2024-05-01 11:59:38创建   2024-05-29 22:40:17更新
来自:豆瓣广播

甚小望远镜的广播: 昨天去亚洲-东方学院拜访了执掌敝校汉学讲席的Wolfgang Behr(毕鄂)教授。亚洲-东方学院其实只有四个系,按成立顺序是印度学、伊斯兰科学、汉学和日本学,汉学系有两个讲席,Behr教授是传统中国(19世纪以前),还有一个现代中国教席已空缺两年,据信校方有意将其改设为现代中国(50%)及台湾研究(50%)教席。(台湾研究长期看好。)和他聊了一个中午,得到了一些有趣的信息: 1. 现在欧美的中国研究非常普遍的问题是研究和教学的脱节。许多综合性大学特别是理工科大学设立汉学职位的主要目的是为学生开设泛泛的历史、文化和当代中国的概论课程,而这和每个学者自己的研究工作基本是无关的。例如,圣加仑大学在2年前刚刚设立了汉学讲师的固定职位,上任的是一位研究明清小说的女学者,但圣加仑是一所以商科为主的学校,她要开的课是当代中国政治经济和国际关系。 2. 北美的中国研究基本上到了花开两支,其他全崩的地步:两支是早期中国(Early China)和中华帝国晚期(Late Imperial China),“Everything in between is declining.” 如果现在还有博士生做比如唐代制度史这样传统的题目,他/她几乎没有任何机会找到教职。 3. 欧洲汉学的中心仍然是法国。巴黎的EPHE, EHESS,CNRS,远东学院,国立东方语言文化学院等机构人才济济,而且几乎每周都会举办横向的面向公众的讲座和讨论会,所有人聚在一起读一本书或者讨论一个问题,有时候甚至就没有主题,然后大量的博士生——90%来自中国——都可以从这样的讨论中收益。这样的氛围在德国或英国都是找不到的。 4. 瑞士没有帝国主义历史,所以汉学研究开展得很晚,在1940年代才在苏黎世设立了第一个全职汉学职位,在法语区,日内瓦要到50年代才有。但是,法语区有才华的学生会全部到法国去学习。戴密微就是瑞士人,你不知道吧? 5. EPHE变成道教学院不是没有原因的,一方面当然是施舟人的强烈影响,另一方面是他们也很清楚那样比较容易获得经费。 6. 美国的早期中国研究基本是德国学者支撑起来的,比如罗泰和柯马丁。 7. 瑞士学生的问题是,他们现在也不再好好学希腊语和拉丁语了,Gym一般只要求二选一,甚至也可以用其他学分替代了。当他们来到汉学系学中文,他们脑袋空空。实事求是地说,我相信你的水平比我的博士生要高。 8. 全球古典(Global Antiquity)的研究现在基本上都要在两个维度中占一项:要么和考古有关,要么和数字人文有关。如果两样都不沾,那么基本中不了大项目。 9. 比较研究将会迎来一个小阳春。 还有很多有意思的点,想起来了再补充吧。

回复
来自:豆瓣广播

尤利西毛的广播: 这几天维苏威计划——用 AI 破译两千年前被火山掩埋的纸莎草卷轴——第一阶段的成功又小火了一把,感受非常奇特,这可能是能进入公众视线的和我的工作最最接近的事了(用机器学习解码/分析从文物上采集的光谱数据,这么冷门的坑,在文物、科学、程序届哪哪都是边缘,但竟然每一环都扣上了,看他们技术文档关键词都无比熟悉,甚至常用工具都重合)(想到我糊了两层墨水的手抄本就悲从中来,墨水一模一样,根本分不开 图1 )。他们的项目真的很令人振奋(一种我不是在搞玄学,是有用的!的确认),也让人嫉妒,看到不少讨论还是有蛮多误解,也有不少值得一提的点被忽略, 还是来从纯技术的角度 #偶尔写写本行 1.首先,这并不是一项古文字学的工作,这里的难点不是“破译文字”,而是使不可见的(层层碳化难以展开)重新可见,几乎是一项纯技术性的突破。但同样的,功劳不止属于 AI, 单靠 AI 是做不到的——整个项目的基础建立在使用同步加速器进行了高分辨率的X光三维断层扫描上,也就是,我们终于可以取得这个已经碳化的卷轴的内部高清数据,才能进行后续分析。整个卷轴只有 10 多厘米,可以想象成一块瑞士卷,被切成 14000 个薄片,由这些薄片拼成 3D 数据。而采集这个数据并不容易:非常耗时,非常贵,并且同步加速器的 beamline 非常非常难约,不是你想用就用的,而且需要将卷轴由专人护送到加速器(移动时的固定用了 3D 打印技术 btw),项目方预估,如果要将 800 个卷轴全部扫描完,大约需要花费 3 千万美元,时间成本上也几乎不可行。于是项目的下一步挑战,是建立能够 in-situ 使用的设备,无需移动纸莎草,无需抢 beamline,且可以全天候运行,努力将成本降到 500 万以下。 2.拿到数据之后,也无法立刻开始解读——整个项目的核心挑战,是将卷曲碳化的卷轴,这团糊在一起的三维粒子信号重新分层,还原成展开的平面。也就是,从一块瑞士卷切片出发,选中面包部分,识别它在整个 z 轴上的走向,把这个扭曲的曲面一层层剥离下来,再拍成平面,甚至是连续的平面。这个过程也十分艰难,因为在岩浆的高温中不同层之间有破损有黏连,并没有那么好区分。目前剥下的 15 个平展的段落(图 2),是聘请专人程序+手动标注完成分层的。目前只阅读了卷轴的 5%,想要达到 90%的目标,势必需要更高效更为自动化的分层算法。 3.识别墨迹已经是最后一步,甚至是相对常规的一步。但不像有些友邻猜测的,莎草纸碳化了,那墨水必不可能是碳墨吧不然怎么读?最地狱的就是,和前些年的 En-Gedi 卷轴含铅墨水,以及最常见的含铁的 iron gall ink 不同,偏偏是 carbon-based, 在 X光下和纸的信号对比度几乎没有。但仍然有差别,红外下其实能看出墨迹,然而红外穿透性差,又无法读取到卷轴内部信息,只能用来扫描早期物理强拆剥离下来的碎片,当做小的 labelled dataset。AI 在这里才发挥了最完整也最擅长的能力:人类肉眼不可见的细微差别,通过神经网络训练识别出来。这里其实没有任何阴谋论的空间,希腊伪史学信徒稍微懂一丁点技术,就会发现,这里的识别使用的不是OCR 技术(直接识别希腊字母)也没有应用任何语言模型,而是小窗口判断墨迹的有无,近似于一个一个点去读这里是否有墨迹,最终产生出一个二元的图像,再人为去读取那些有墨的部分连成的 pattern (图 6 为失败模型)。这就从底层逻辑上避免了模型去生编。退一万步,不同参赛选手的模型也是有交叉验证的。 最后还想提一点,整个项目从数据到每一步技术突破,都是完全开源的,如果你想,可以从他们的官网和 github 上下载到全部的数据和代码。并且一个这么宏大的项目,被非常精确的分割成了一个个阶段(先读一个字,再读 5%,然后是读完整的一卷,最后扩展到整个馆藏和尚未被挖掘的部分),每一个阶段又设立了数个小的节点,变得可以执行,而每一次突破和技术的共享都为后来者扫清了障碍,这比起各自闭门造车被这个庞大的困难压倒要高效太多。整件事回顾下来,甚至有种乌托邦感,人类的智慧集结在一起,又与遥远的文明产生连接,让人难得想要赞美科技进步,觉得人类也不算完全完蛋。Nat 说 "It wasn’t clear it was possible until we did it." 非常期待接下来的进展

回复
来自:豆瓣日记
青鹿 110人喜欢
该事件源自于盖蒂研究所上个月的一条新闻。 这个看似“ 一条大便”的物体,实际上是出自庞贝的姊妹遗址“赫库兰尼姆古城( Ercolano )”的一份因高温火山灰而碳化的纸莎草纸书卷。 公元79年维苏威火山爆发,铺天盖地的火山灰在掩埋了庞贝的同时也掩埋了周边的一些城镇,赫库兰尼姆也在其中。 由于其地理位置滨海,赫库兰尼姆成为了当时贵族消夏避暑的后花园。因此尽管其比庞贝的规模要小很多,但却比庞贝更加富裕。 1709年,当地居民在掘井时发现了遗迹从而开展了考古工作,这比1748年发现、1763年确认的庞...
回复

什么是豆列  · · · · · ·

豆列是收集好东西的工具。

在豆瓣上看到喜欢的内容,都可以收到你自己的豆列里,方便以后找到。

你还可以关注感兴趣的豆列,看看其他人收集的好东西。

这个豆列的标签  · · · · · ·

Δελφοί的其它豆列  · · · · · ·  ( 全部 )