【浮世汇855】什么叫做尽最大努力去做成一件事

dasheng @ 2024年03月09日  浮世汇

【1】@高飞 

Claude 3 用几分钟,搞定了语言学家两年的工作,也是一个惊人的案例。(昨天我们发了一个Claude3几分钟搞定了新量子算法的,今天这个是文科语言学的,人类是不太容易横跨这么大的知识领域的)
原文作者叫An Qu(hahahahohohe on X.com),在X上发布了一个使用Claude3的案例。具体而言,他用了几千个翻译对数据,就实现了一个小众语言的理解翻译,达到了一个专业学者两年的工作。他在 GPT-4 上进行了相同的测试,就失败了。(看好OpenAI近期发布某些重大更新,不然有落伍之忧)
全文如下:
** 
今天在测试 @AnthropicAI 的新型模型 Claude 3 Opus 时,我经历了一件令人震撼的事,感觉仿佛见证了一个奇迹。虽然不想听起来太夸张,但这真是我当时的感受。
背景很重要:过去两年里,我一直在为我的母语——车臣语(Circassian)研究自然语言处理(NLP)。车臣语资源非常稀缺,在互联网上几乎无迹可寻。它属于孤立的车臣-阿布哈兹语言群,没有任何相关的语言。复杂的形态结构和有限的数据资源,让它成为了语言模型面临的一大挑战。
这几年,我艰苦地从少数资源中整理出了64K对翻译配对,并利用特定的模型(如T5、MLM-100、NLLB-200等)成功实现了俄语-卡巴尔迪安语的机器翻译,取得了不错的成绩。
我决定对 Claude Opus 进行一项试验。我发起了一个新对话,只上传了5.7K随机选取的翻译对,这只是我64K数据集中的一小部分,甚至没有覆盖全部的词汇量。我想看看它是否能够基于这些例子翻译新的句子。
我没怀有太多期望,仅仅是让它将一个简单的句子——"我躺在床上"从俄语翻译成车臣语。Claude 不仅提供了完美的翻译,还详细解析了语法和形态学结构。
起初,我以为这只是碰巧,这个特定的句子可能正好在提供的例子中。但并非如此。
我尝试构造了一个独一无二、极不寻常的句子,理论上不可能存在于数据中。结果,Claude 再次提供了无懈可击的翻译和分析。仅仅依靠极少量的数据,Claude 的表现竟然接近于我为机器翻译特别训练的模型。这让我难以置信。
进一步的测试包括文学作品中的复杂段落、最近的新闻报道,甚至是语法和书写系统都显著不同的车臣方言文本。Claude 一致地展现了对语言结构深刻的理解,智能地推断出未知词汇,恰当使用借用词,提供可能的词源分析,在翻译中保留原文风格,甚至在需要时创造新词。所有这些成就都是基于仅几千个翻译对完成的。车臣语是一种具有复杂形态结构和语法的黏着语言。
要完成这些任务,需要深入理解语言本身,若由一个不熟悉这种语言的语言学家来做,可能需要至少一年的时间。然而,Opus 仅仅通过5.7K个随机翻译对,在不到一分钟内就轻松掌握了这些细微之处。
作为对比,我在 GPT-4 上进行了相同的测试,结果完全失败。它甚至无法翻译最简单的句子,更不用说理解语法的复杂性了。我之前也试过在类似的数据集上对 GPT-3.5 进行微调,但得到的也只是杂音。
我不确定 Anthropic 是如何做到这一点的,但这明显与其他任何东西都不同。虽然许多人对其在合成基准测试中的领先地位表示怀疑,但我亲眼见证的,在一个全新且极具挑战性的基准测试上取得的成果,确实令人震惊,这在训练数据集中几乎是不可能的。
为了排除潜在的数据污染,我尝试了相同的提示,但没有附上样本翻译,结果Claude无法进行翻译,并表示不熟悉车臣语。
这一发现意义重大。我两年辛苦工作的成果,Claude 只用几千个示例就轻松实现了。这对于资源匮乏的语言来说,无疑是一次飞跃,对许多其他领域也同样有着深远的影响。
我原本以为这样的进步需要多年才能实现,但它已经发生了。未来已经到来,而且它令人惊叹不已。



【2】@开牡蛎的于勒叔叔 

#农夫山泉客服回应东方树叶包装#一场对民营企业家的悼念,异化成了对另一家民营企业的猎巫。拉踩的习惯不知道什么时候从饭圈泛滥到了国货圈了。宗老去世后,把娃哈哈农夫山泉放一起对比一下这不是在无事生非吗?



【3】@金小姐在帝都 

#职场关键词# 我在非常年轻的时候,无意中被德国的一位前辈同事上了很重要的一课:什么叫做尽最大努力去做成一件事。这个lesson对我后来的思考方式影响很深。当时我在汉堡总部参加培训,被安排在一些核心部门轮岗。图片部的资深编辑是一个近60岁的老太太,年轻的时候做过杂志设计总监,后来为了家庭退出过职场一段时间,再回来的时候,管理层已经没位置了,只能去一线。这是故事的大背景前情。
杂志是周刊,节奏快,每天早晨都有编辑早会。这一天的早晨,主编随口提了一句:某本娱乐周刊上刊登了某明星的八卦照片,她想要试试看这张照片是否适用于她们自己这本周刊新一期的某个栏目插图。然后接下来的几个小时里,我旁观了我的这位德国同事完成任务的全过程:
第一步:查阅所有日常合作的图片网站,变换各种关键词,搜索结果都为0;
第二步:致电这些图片网站的对接工作人员,询问是否有这张图片,然后被告知可能是那本杂志的私人供稿渠道,该张图片为非公共流通资源;
第三步:打电话给那本娱乐杂志,咨询是否可以共享这张照片(这步我当时觉得挺神的),被对方拒绝;
第四步:仔细查阅该本杂志的版权信息页,找到了摄影师的名字,然后通过行业名录,找到了摄影师的联系方式;
第五步:直接打电话联系到了摄影师,得知这张照片的版权还没签独家,顺利买到照片版权(并不贵),任务完成✅
我在旁边默默在想:如果是我,大概会停在哪一步?可能得知这张照片是非公共渠道流通资源,就差不多了。因为第一我会默认那本杂志的编辑不会愿意共享,第二,主编也没有说这张图独一无二非要不可。我可能会给一个替代性的解决方案,比如其他类似的图片备选。
还有一部分人可能在第一步就停下来了,直接告诉老板"图片库里搜不到这张图"。在办公室里类似这种对话情景还挺多的。
但她就试了所有可能性,而且并不是在老板给高压的情况下。这个小老太太平时也会在跟我一起去公司餐厅吃饭时抱怨一下现有职级低工作繁琐之类的话题(每个打工人都一样!),但是当一个有点难度的活儿过来的时候,她还是会高高兴兴地一直尝试到最后一步直到解决问题。
其实最后搞没搞到那张图不是最主要的,最重要的是你究竟能走到哪一步,是不是试过所有的执行路径了。
idea is cheap. 一个聪明人想到一个好主意时,一定同时有另外一千个聪明人也想到了。但是只要你开始落地执行,你就已经赢了至少50%的人。然后再问问自己是不是已经做了所有能做的尝试——可能这时候你已经能赢过90%的人了。这就是我在非常年轻的时候,学到的朴素的真理——没走到最后一步,就不算尽力;走完最后一步,即便没成功,也不需要后悔。
这就是今天想唠嗑的关于职场关键词"渴望"的第三条原则,RULE3: 当你在说自己很努力的时候,先看看自己是不是真的尽力了。能否走到最后一步:首先是意愿度,其次是思维方式,最后是有没有执行力。这些都需要日常训练和练习。职场是个耐力赛,试着把"尽所有可能"训练成一种思维方式和肌肉记忆动作,你会赢的。



【4】青光楚辞 

我不是莫言的读者,支持莫言仅仅因为反对文字狱,文艺创作者应拥有创作自由。没错,这就是文字狱,只是很多人不敢说出来,莫言并非不可以被批评。编辑补充一句。当年根据他作品改编的《红高粱》,从国内媒体到海外华人,有很多观点认为丑化国人形象,而且对我有一定影响,导致我一直不太喜欢张艺谋。但批评应局限文艺,不能无限上纲。如果这种行为逻辑合理,发起这事的人自身也会受害,不需要做太多,研究你过去一年的言行,很容易找出你应该被枪毙的理由。结合前段时间战马行动,明眼人都能看出点苗头。无数底层LOW逼蠢蠢欲动试探风向,想要知道属于他们的时代是否到来。他们是这样一群人,没有社会资源、没有权力、没有财富积累,甚至没有很好的身体素质,遵循正常途径没办法获得阶层跃迁,但只要能通过某种无法反对的加持肆意撕咬任何人,他们能获得自己想要的一切。


【5】押沙龙 

六神磊磊说的对,莫言是个谨慎的作家,并没有什么大声疾呼、批判社会的意思。他气质上更像沈从文而不是鲁迅。而他写的那些东西放在当时的创作环境里,也不算出格。只不过现在化粪池的水位上升,壮士们也不清莫言创作时的环境气氛,高估了莫言的政治性,结果把安全岛上的莫言也给淹了。


【6】雄狮亨利 

孟德斯鸠当年说根本没必要对哲学著作进行审查。理由是社会上90%的人根本不看书,看书的人里90%只看小说,剩下的里也只有10%的人会读一读哲学,但读了的人有一半看不懂,看懂的人还有一半不同意书里的观点。

他这么说显然是忽略了"哲学著作"的另一个重要组成部分,那就是"爱情动作小说"。十八世纪中后期,秘密出版的"爱情动作小说"也算"哲学著作",这些书比今天狭义的"哲学著作"受欢迎多了!

配图不是孟德斯鸠而是马勒泽尔布,因为他当过出版审查官。

最近看的几本书里马勒泽尔布都是重要角色。莫普"清算"高等法院的时候,他作为间接税法庭庭长跟莫普斗争。讲直接税的那本里他在路易十六时代是大臣。《智慧巴黎》里他作为科学院的院士、出版审查官也是重要角色。没有他"窝藏"《百科全书》的手稿、给狄德罗通风报信,《百科全书》就半途而废了。没有他对禁止《百科全书》而且要求出版商对预定人退款的命令阳奉阴违,《百科全书》的出版商就可能要破产。这么一个人"卒年"1794,毫无意外的也是因为上了断头台。


【7】蒋经国的历史评价问题


◆[在储君时期,] 整体来说,虽然目前仍无法确认蒋经国在个别政治案件里所扮演的角色,不过作为情治机关的最高领导者,情治机关在此一时期种种侵犯人权的恶行,蒋经国自然应有一定的直接「行政责任」、「政治责任」与「历史责任」。

◇[当政初期,] 蒋经国虽推动「革新保台」的政策,试图补强KMT当局统治的正当性,却没有改变对反对势力、人民思想言论的箝制态度,甚至对台湾本土语言、文化的压制还更为严厉。加上虽然开放人民透过选举可以参与中央民意机构,但中央民意机构仍由资深中央民意代表主导,因此,蒋经国在这个时期的改革,离民主宪政体制的落实,还有相当大的距离。

◆解除戒严,则是在制度上改善了戒严令下根据《戒严法》对人权的限制,以及违反《惩治叛乱条例》的嫌犯也不再受军法管辖,改归司法审判。此一改革固然相当重要,不过动员戡乱体制仍然继续存续。换句话说,单单解除戒严,仍不足以恢复宪政体制对人权的保障,自由化的改革也尚未完成。

◇1986年在国内外要求改革的压力下,选择了自由化改革的方向,他容忍党外人士冲破党禁组党,决定解除戒严、开放报禁,配合以《国家安全法》为核心的「国安三法」,呈现了有限度改革的特色。不过,他仍然没有推动终止动员戡乱体制的意愿,并试图维持万年国会的体制,只是扩大增额中央民意代表的名额,而由时间来解决此一问题。蒋经国晚年推动前述的政治改革,在台湾政治改革脉络中应该如何定位呢?如前所述,透过蒋经国推动的改革,人民仍然无法透过制度性或定期举行的选举,决定执政者(党),因此他所推动的政治改革,与所谓民主的落实或是完成民主化的改革,仍有相当的差距。

◆就此而言,蒋经国推动的解除戒严的改革措施明显有其限度,不仅没有完成民主宪政体制下的自由化改革的工程,甚至也没有完全落实《戒严法》规定的解除戒严的自由化改革。进一步说,固然蒋经国宣布解除戒严,但是他以《国安法》作为替代的改革方案,则使人民遭到军法审判的案件无法在《戒严法》体制内得到原本应有的救济,相关案件乃至戒严时期侵害人权体制无法透过普通司法体制进行历史的清算,原本《戒严法》赋予的「转型正义」机制,在此一体制下也几乎无法展开。因此,解除戒严固然对台湾的自由化改革而言,是重大而且关键的一步,不过,由于《国安法》的规范,却达不到《戒严法》体制下的解除戒严效果。而且动员戡乱体制依旧不变,在《惩治叛乱条例》及《刑法》100条的规范下,原本宪法保障的表现自由(言论自由)仍然受到强力的压制,甚至只是因为不同意KMT当局主张的国家认同,就可能构成叛乱罪。而台湾终结白色恐怖时期的「言论叛乱」,完成自由化改革,落实民主政治,使台湾成为「自由之家」评比的「自由国家」,则是李□□任内的改革成果。


【8】@张敞 

《美国小说》与《利益区域》有一样的缺点,那就是立意很好,但开掘度不够。把一个好的想法撑下去,需要的是编剧能力,而想到一个想法或故事,仅需要灵光一闪。当然,相比近日大火的《周处》——它的根本问题也是好点子、烂铺排——完成度还是更高一些,更沉着和复杂一些。但也真奇怪,仿佛大家都进入的是同一个困境,那就是:编剧的孱弱,导演的无法深入,以及想要的东西的游移不定所导致的漫漶、虚假、空洞、有思考而无深度、能唤起情绪却无法仔细推求、具体一事讲不好因而产生不出更多寓意和象征……演员也都很好,可是剧情和人物某种程度上都是断裂的、片面的、功能性的,因此角色与人物都是服务于一种理念而已,即使他有喘息,有眼泪、有困惑,亦是电动人的、仿真的,是早期游戏里的NPC,走路会一顿一顿,有无谓的、失去意义的瞬间起跑和"平静的慌张"。

西窗随记 

文艺必须为某种主义某个人群某种身份某个理念服务,以及无所不在的审查和动辄得咎的政治正确观念,彻底摧毁了文学艺术的基础,本应最自由的领域变得最畏手畏脚,结果就是这样。最搞笑的是有人一边骂作品太肤浅不深入,一边骂作品立场观念视角太不正确,还不觉得自己是矛盾的。



【9】海莉宣布退选。特朗普和拜登均对此发表了声明:

特朗普:海莉惨败了,她的钱很多来自民主党,选她的人有50%是左翼。欢迎支持她的人加入到我这场最成功的竞选中来,拜登是我们的敌人,在毁灭这个国家。

拜登:在当前的共和党,竞选总统是需要勇气的。因为很少有人敢于说涉及特朗普的实话。海莉是其中一个。我欢迎海莉支持者来我这边,虽然我们有很多政见不同,但在民主、法治、个人尊严、支持北约上,我相信大家能找到共同点,这不是一次普通的选举。


【10】安藤樱在接受W中文采访时的一段回答:

导演是不是会有"这个年龄段的人物想找她/他来演"的考虑呢?我不能断言。但是我自己每次都想以新鲜的方式去表演。与其说是我在表演,不如说是发生在那个时间点上的相遇。于我而言,演对手戏的人不一样,天气不一样,当时吹拂的风也不一样,这些都是只存在于那个瞬间的。而我要做的就是乘上每个这样的瞬间的风去创造角色。我觉得这样做就能创造出独一无二的人物,一直是怀着想要去珍惜每个瞬间的相遇,乘上只存在于那时的风的心情来演戏的。

如果能保持这样不断变化的自我,哪怕是拿到了相同的角色,我自身已经改变。可能有人担心自己被定型,但我希望自己本身不断改变,接受自己在日复一日的生活中的变化。同时我也会受到周围环境带来的、饰演不同的角色带来的影响,日常生活中自己也会变化,如此时时刻刻不同的自己,无论角色是否相近必然不会是相同的呈现。世界上不存在每天都过着同样日子的人,只要在变化,就必然会是不同的角色。我就是努力在乘着变化的波浪。


【11】茨威格死于昨日世界 

哈夫纳在《一个德国人的故事》里说,1933年国会纵火案的时候,德国总统兴登堡立刻颁布行政命令,取消了个人的言论自由以及通信和电话的秘密,警方有权径行搜索民宅,采取没收及拘捕行动。在那个时候,大部分德国人相信的确是德国共产党在国会大厦纵火(事实上很有可能是纳粹干的),这种判断没什么可责备的,但他们必须被责备的地方,"是在纳粹时代首度表现出来的集体软弱性格……一般人像绵羊似的乖乖就范,好像事情本来就应该是这个样子——既然德国共产党把国会大厦烧了,那么政府当然有权采取"强有力的干预行动"……没有人提出质疑,为什么从此我们的电话交谈可以被窃听、信件可以被拆阅检查、书桌可以被外力强行打开,仿佛那根本就没有任何不对劲的地方。"


【12】欧洲文艺评论 

当代西方四位虚拟汉学家:
Libgen,李伯庚
Z-Library,齐理博
Anna Archive,安娜·艾凯吾
Scihub, 赛哈伯


【13】@PACIONON 

其实人生的容错率是很高的 这两年慢慢发现很多东西并没有想像中的了不起 没读上大学不会怎样 没找到稳定的工作不会怎样 不结婚不会怎样 不社交不合群不会怎样 自己一个人真的不会怎样