我參加了NYT的AI與人類寫作測驗。我認為這並不是評估問題的好方法……首先,人們可能會試著猜測哪一段是人類寫的,而不是誠實回答。但我也認為單一段落並不是評估問題的好標準。
AI 寫作的那種令人厭倦的特性在較長的輸出中顯現出來。此外,我在想是否存在類似於品酒的 "盲測" 效應,人們在盲測中偏好較甜的葡萄酒,雖然他們從不想喝完整瓶。
44