我参加了纽约时报的AI与人类写作测验。我认为这并不是一个很好的问题评估标准……首先,人们可能会试图猜测哪个是人类写的,而不是诚实回答。但我也认为单个段落并不是评估这个问题的好方法。
AI写作的那种令人厌倦的特性在较长的输出中显现出来。此外,我想知道是否存在一种类似于葡萄酒的“盲品测试”效应,人们在盲目状态下更喜欢小剂量的甜酒,但从来不想喝完整瓶。
39