与其说是Ai还做不到的, 不如说是人该做的

看了一个关于Ai的TED演讲. 感觉讲得真好(虽然仍然没有解决我对Machine Learning这样的东西的疑惑, 即, 演讲中的那些系数是如何收敛得到的等), 把人工智能想象成一个映射:

\[\boldsymbol{Y} = A \boldsymbol{X}\]

于是当我们将输入, 比如说一张图片量化扔进这个”机器”里面, 经过已经训练好的神经网络 $A$ 就能够得到一个量化的输出 $Y$, 比如说: “叮~ 您有一张新的色图到账. “

color-pic

不过怎么得到这个神经网络, 视频里面并没有仔细地介绍, 一个简单的想法是这样的:

(define (make-A X Y)
  (define (iter-make-A X Y old-A)
	(let ((A (improve-guess old-A)))
		 (if (good-enough X Y A)
			 A
			 (iter-make-A X Y A))))
  
  (iter-make-A X Y 1))

(define (good-enough X Y A)
  (less (- (* A X) Y) precise))

(其中 improve-guess 部分没有很详细的介绍. )

但是这样往往是将一个高维向量映射到一个低维向量去, 比如对数据进行分类, 判断等等. 但是如果将这个等式逆转, 比如已经知道了 $Y$, 想要生成 $X$, 那么就会怎么样?

(尽管其中会有一个如何处理那些因为投影丢失的信息如何还原, 或者更加合理地说, 如何生成并填充这些信息的问题, 也没有很清楚地讲. )

这个时候, 相当于计算机在根据结果生成 “原因”. 于是就有了那些 通过文字输入, 或者图像输入来生成数据等方法的高级玩意了.

鉴于俺现在对什么人工智能啥也不了解, 所以后面的东西都是瞎写的, 如果真的成了民科的话, 那么也是很正常的事情了.

一根有力量的线

很久以前, 我的老师跟我这样说: “那些(画画的)老先生年龄大了, 握不住笔, 画画的时候就抖来抖去的, 你(现在)不要去学他们的那种线条, 因为你抖不出来, 他们虽然弯弯抖抖的, 但是还是很有力量的. “

虽然过了这么久, 我已经成为了一个不会画画, 整天摆烂的鸟人了. 害.

但是, 如果我们想要画一根有力量的线, 那么该怎么画呢? 举个例子:

strong-line

这张图片里面, 除了最右边的那个线稿一样的图是我画的, 其他都是我用 Stable Diffusion Demo 这个AI生成的, 感觉挺有意思的, 尝试了使用 “a strong line”, “a strong string” 这样的输入作为生成的文本.

还是先来介绍一下我的想法吧. 其实, 挺无聊的, 灵感来自于我的 不知道为什么突然有一天被划伤了的手绘板. (也许是因为笔尖坏了? ) 于是我们就有了一根(物理上)有力量的线…

(我将这样的也输入进了AI: “* a wocam board broken by the pen in the style of watercolor”, 结果在图中可以看到. )

某种程度上来说, 我画的东西并没有十分贴切题目的要求, 因为我并没有(直接地)画出线, 并且也没有画出力量. 一切都不过是侧面描写罢了.

类似的还有 “踏花归来马蹄香” 的类似的东西 (Galloping back over flowers, fragrance sticks in horse hooves)

galloping-back-with-flower-scent

可以发现, 在传统意义上来说, AI已经干得很不错了, 如果说前面的 “strong line” 是因为描述的内容太少, 太无关, 限制了AI的发挥, 那么现在这个题目因为给的描述非常的详细, 所以得到的结果十分的好.

如果没有历史上那个神仙的立意的话.

类似的还有齐白石的 “蛙声十里出山泉” 之类的牛皮作品, 具体的我就不一一列举了.

AI: 年轻 人不讲武德

确实, 在某种程度上来说, 那这种抽象的东西来和AI比较, 属实是一种不讲武德的行为. 并且在画出来的对象和描述的匹配程度上来说, 确实是AI “更胜一筹”. 并且在量上, 好像 AI 也更多一些…

但是这样也就在某种程度上来说, 限制了AI的 “上限”. 即, AI必然需要 “尽可能地” 给出一个可靠的, 正确的结果. 毕竟如果是我的话, 我肯定不希望帮我处理数据的计算机给的东西不可靠… 并且, 哪怕现在AI生成的图像并非是完全完美的 (比如上面马的图片中的第一张, 在左下角的马腿和人腿重合了… ), 这样的生成目标必然是需要一种 “像”.

那也许也能够说, 那我在处理词句后, 生成图像之前, 再加入一个联想网络, 比如像鲁迅先生说的那样的东西:

一见短袖子, 立刻想到白胳膊, 刻想到全裸体, 立刻想到生殖器, 立刻想到性交, 立刻想到杂交, 立刻想到私生子. 中国人的想象惟在这一层能够如此跃进.

然后可能未来就会出现一个处理抽象输入的绘画AI吧… 比如说: 一根有力量的线 -> 画 一根 有力量的 线 -> 用力 画 线 -> 破坏 画 线 -> … -> 被破坏的数位板 -> … -> 画.

emm… 虽然现代的人类早已经超过了鲁迅先生的描述, (其实鲁迅也不是在吐槽人的想象, 倒是在吐槽这层被封建思想训练 形成的奇怪神经网络吧… ), 比如网络上到处是看到一点点东西, 就会惊呼: 卧槽, xxx. 之类的. (可能我的猪脑并不能帮我联想到吧, 总是跟不上这样的奇怪联想… 搞不懂笑点. )

啊, 跑远了, 那么是否说, 这样的能解决抽象问题的AI, 厉害么? 废话, 当然厉害啦. 在创造力方面上, 能够联想的话是多么厉害的一个操作, 虽然我觉得目前的工作并不会往这样的方面去靠拢… 原因仍然是, 因为AI是有目的性的一个东西.

或者说, AI是在尽可能地去逼近一个合理的东西. 也就是尽可能地在 – 避免失误.

人是有极限的

但是人的 xp 并不是. (误)

体育课集体摆烂的时候, 一边非常佛系地颠球, 一边目光呆滞地望着远方, 仿佛有声音从远处传来, 于是焦点重新回到眼前的那坨爬满藤蔓的铁网, 于是声音就来到了边上, 是几个人在对话:

“为什么会有这样和那样的剧情呢? 你肯定看过的吧, 那你觉得是为什么呢? “

“谁知道啊, 可能就是有那么一种 xp 吧… “

(注: 事实证明, 写得太含蓄可能并不能有助于信息的传递, 因为当我把这个问题拿去问了一个应该是非常 “懂” 的同学之后, 她/他/它先是小心翼翼地用了一个睿智的表情包来试探, 然后就: “本子我看的少 文我看的多”… 嘛, 果然, 不太有助于信息的传递. 所以读者产生任何的误解都与我无关, 我只是在以科学务实的精神正经地讨论. )

那么这和 AI 有什么关系呢? 好像没什么关系, 因为哪怕是 “创作能力” 如此之强的 AI 也没法搞出这么离谱的东西. 对, 没错, 就是因为 AI 也搞不出来, 所以就和 AI 有关.

也许未来会有一个牛人把这些神经网络应用到这样的漫画创作之类的, 尽管我只能说, 这样的神经网络应该会比目前的现有的人肉神经网络 “高效” 一些. 比如现在所谓的异世界厕纸?

那么一个简单的问题, 是否 AI 会因为学习了非常多的样本, 最后生成了超出原本的样本的东西呢? 还是只是类似于一种 “数据造假” 的 “技术”, 有点像是先画了一条可能的曲线, 然后用随机偏差来生成一堆的理想的测量数据. 但是如何生成一条不存在但是却可以存在的曲线? 这可能是 AI 做不到的事情了.

不过某种程度上来说, 倘若我们找不到一个能够这样训练 AI 的方法的话, 那么可能现在的垃圾教育就没法训练出超越 AI 的学生了. 毕竟训练一个 AI 在目前看来, 估计都已经比训练一个人所需要的时间和金钱还要少了, 并且, 这样训练的 AI 估计还会比那样训练出来的人更好呢.

毕竟, 现在我们讨论的是如何在复杂空间中找到一个对期望解最优的一个收敛, 而不是在复杂世界里面随便的一个流浪. 某种程度上来说, 成功变成了一个单义词, 而不是相对自己的快乐.

害, 何必剥夺自己人的身份, 去和机器攀比呢?

那么人该前往何处? 总不能继续把自己当作是一个高级的神经网络, 一遍遍地训练自己, 向着唯一的答案逼近吧? 为什么不能放弃去找一个特定的答案, 只是踏上流浪的道路, 风尘仆仆.