设想一种基本计算部件,它的输入和输出都是连续的实数,也不局限于进行二元逻辑运算,那就跟组成人工神经网络的基本元件比较接近了。
我们管它叫神经元(neuron)。
如果小说中的三体人真的可以一秒钟反应十万次,而且众多的三体人通过类似神经元的方式进行连接,那么,他们所构成的将不再是一台普通的计算机,而很可能是一个具有超级人工智能的存在。
而由简单元件组合起来的力量,在现实世界的人工神经网络中已经真正地显现。
神经网络中的最基本组成单元——神经元(neuron),也被叫做感知器,(perceptron)是一种早期的神经元结构,在上个世纪五六十年代就被提出来了。
现在它在神经网络中已很少被使用,但理解它有助于理清其它类型神经元的基本结构和设计思路。
一个感知器的定义元素包括:
1.有多个输入:x1, x2, x3,...,它们只能是0或1。
2.有一个输出:output.只能是0或1。
3.每个输入对应一个权重值:w1, w2, w3,...,它们可以是任意实数。
4.有一个阈值:threshold.可以是任意实数。
5.输出output取决于各个输入的加权求和与阈值threshold的大小,即:如果w1x1 + w2x2 + w3x3 +...> threshold,则输出output=1,否则输出output=0。
直观上理解,感知器相当于一个决策模型,输入表示进行决策时需要考虑的外在因素或条件,权重表示你对某个外在因素的重视程度,而阈值则表示你对于这个决策事件本身的喜好程度或接受程度。
举一个例子:假设周末有一个同学聚会,现在你正在决策要不要去参加。你考虑的因素如下:
1.如果那天天气好,那么你就更有意愿去参加。用x1=1表示天气好,x1=0表示天气不好。你对于天气这个因素的重视程度为w1=3。
2.如果某个你讨厌的人也去参加聚会,那么你就兴趣索然,不太乐意去了。用x2=1表示你讨厌的那个人去参加聚会,x2=0表示那个人不参加聚会。对应权重w2=-5,负值表示这个因素的出现会降低你去参加聚会的意愿。
3.但如果你暗恋的一个女孩去参加聚会,那么你无论如何也是想去的。用x3=1表示那个女孩去参加聚会,x3=0表示她不参加聚会。这个女孩对于你太重要了,所以有一个很大的权重:w3=10。
现在假设阈值threshold=2。我们根据前面的规则去计算output,这个计算过程就相当于决策过程。如果output算出来等于1,那么你就去参加聚会,否则就不去。
决策结果无非是下面几种:
1.如果你暗恋的女孩去参加聚会的话,那么不管其它因素,你肯定就去了。因为权重w3实在太大了,不管另外的输入是多少,都会导致加权求和后超过threshold=2。
2.你暗恋的那个女孩不去参加聚会,而你讨厌的那个人去参加聚会。这时不管天气如何,你都不会去了。
3.你暗恋的那个女孩和你讨厌的那个人都不去参加聚会。那么你去不去最终取决于天气怎么样。