复杂网络的几何模型?

有点时候觉得复杂网络之所以可爱,就是在一个特定的场合下或许可以几何化,变得很直观。当然,简单的几何化就是点与点之间的连线,不过那样我倒是觉得稍显纷杂,虽然有方程可以描述,但还是不够简洁。

前几天在校内无聊的看帖子,有个很恶俗的帖子中有句很经典的话,大意是:

想知道你的年收入是多少吗?把你周围的10个好朋友的年收入加起来,然后除以10得到的平均数就大概是你的年收入。

这句话的依据就是“物以类聚,人以群分”,所以你的社交圈往往也离自己的实际生活不会太远。姑且我们不去深挖那些细节上的陷阱,从一种很单纯的层面来看,假设每个人只与10个人有社会网络意义上的联系,而后整个社会(比如有1000人)以这种联系互相连接在一起,且满足每个结点(即每个人)上的数值等于周围结点平均值。那么这个模型会是什么样子呢?

当然这可能是个三维空间都承载不下的几何模型,我的第一反应是“球”。简而言之,这个“球”得是一个匀质的球。球有什么好的特性呢?下面细说。

不知道大家有没有一个比较奇怪的“习惯性动作”,反正我是经常会这样,那就是在看电视的时候没事干就折腾遥控器玩。我折腾遥控器的一大习惯就是在遥控器的所有键上找到一个键,可以用手指单点这个键的时候足以支撑整个遥控器的平衡。其实说白了,就是找一个近似的“重心”。

球最好的特性之一就是在球面任何一个点栓一根绳,然后垂直下落,那么通过该点的垂线一定通过球心。如果我们此时把球分层面来看,那该点也一定是这个层面上的“重心”。不知我这样的说法是不是有些难以理解,简而言之就是你用手指顶起球面上任意一个点,都可以举起球来,就像篮球运动员转球似的。这样的平衡,是不是可以视之为一个“不动点”?

在社会网络这个模型中,或许很难去定义一个“重力”或言之“外部物体的引力”,可能只有内部各个节点之间的“万有引力”。这样一来,是不是在某种意义下各个结点都可视为一个特定层面的“重心”,从而满足了“该点值等于周围结点的平均值”?当然这里对于每个点的赋值或许要稍稍复杂些,甚至不一定是静态赋值(即可能是某个其他值的函数),因为我们在转球的时候就重新切割了层面,所以原来的坐标轴实质上已经改变了。

当然,我喜欢球的另外一个因素,就是很容易从中分离出其他的简单模型,比如“正四面体”。正四面体的每个顶点都满足到其他三个点的距离相等,而且也可以视作重心在各个层面上的“投影”。这样一来,从逼近的角度,我感觉最后还是会成为一个近似的“球体”。

这样绕来绕去或许有些繁琐了,也离我们起初的议题有些远了。可惜我一时想不出来什么办法来检验一下上面那个“收入平均值”的命题,若是能有如此的数据或许真的可以建立起来一个比较好玩的社会网络模型,然后看看它到底长得什么样子。大家喜欢社会网络模型可能的原因是它可以很容易的嵌套入各个细微的领域,是研究从个人行为到群体行为聚集的一种模拟。或许这样一来,经济学和心理学关心的很多议题,比如储蓄行为、利他行为都可以找到一种新的解释。

最后推荐一篇报道吧,可能有点稍显陈旧,是Economist杂志一月底的一篇特别报道:A world of connections。大家自己去网上搜搜吧,反正我看的是Google缓存的PDF版,官网不知何故打不开。里面说了一些最近sns社区网站发展的情况,有意思的一些部分包括Pro ting from friendship、A peach of an opportunity等等。Facebook等或许是信息时代最先实践着社会网络模型的代表,它很大程度上在从商业灵敏嗅觉的角度挖掘着、探究着社会网络的价值。感觉很快,各个学科都会给予进入这个领域来做一些研究,信息安全的需要研究新的加密和隐私对策,做硬件的或许需要定制一些新的架构。Twitter上现在的信息冗余已经略有泛滥的程度,所以是不是信息的筛选、甄别和评价机制也需要有相应的对策。有句很经典的话,“发明是为懒汉服务的”。从商业价值层面,这样的挖掘会有收益上的激励。而从经济学层面,是不是有着更多的探讨空间,来研究人类的行为?如果经济学的定位之一依旧是“研究人类行为的科学”。

或许每朵花恰可以代表一个人

我依旧秉承着这么一个观点,互联网是研究经济行为最好的实际中存在的模型和近似。因为信息的传递,对经济行为来说,实在是太重要了。

Posted by cloudly

谁能告诉我Akismet怎么了?

前几日Hercy学姐特意发短信给我说在落园留言留不上,我还没在意。今儿突然想起来Akismet这个插件最近有些抽风,果然去垃圾评论那里看了看,若干条有用的评论都被凄凄惨惨的过滤掉了。最诡异的就是不仅仅有新的来客,一些老主顾们也被无情的过滤掉了。像思喆大哥22号的留言我现在才看到,keelii换域名的留言也被过滤了,老饕和Calvin的留言也就那么牺牲了……真的是诡异到家了。

前几日Gmail貌似过滤也严格了起来,很多新的邮件不知为何就归到spam里面去了。害得我三天两头得去垃圾箱翻翻。没想到wordpress也来这招,而且害得我这么久才发现,真是对不住大家。

Anyway,希望大家沉得住气,继续留言,我一条一条恢复。按说只要原来有评论通过的记录,应该下次就不会被屏蔽了。这个Akismet弄的,都快成白名单了。

Posted by cloudly

复杂网络和社会网络

在正式的写昨天列下的三个议题之前,我想先说一点关于复杂网络(complex network)和社会网络(social network)的东西。

第一次从学术意义上接触这两个词儿还是不久之前,也就是去年冬天的R会议上。已经记不得是谁的presentation里面有一幅很经典的复杂网络的图了(当时学到的东西太多了,很难一一拎清楚来源了。欢迎各位知情人士把图扒翻出来给我),而后大家的话题也多多少少牵扯到复杂网络。

先澄清一下这两个概念之间的区别:从我的理解来说,复杂网络更多的是一种数学工具,一种分析问题的方法。而社会网络则是一种概念和定义上的东西,是社会学研究的对象。现在社会学研究社会网络的时候会经常用到复杂网络的工具,这也是二者的结合点。简而言之,复杂网络>社会网络。

或许社会网络中最著名的就是“六度分割理论”:

美国著名社会心理学家米尔格伦(Stanley Milgram)于20世纪60年代最先提出。“你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生 人。”

还有一个著名的“150法则”:

从欧洲发源的“赫特兄弟会”是一个自给自足的农民自发组织,这些组织在维持民风上发挥了重要作用。有趣的是,他 们有一个不成文的严格规定:每当聚居人数超过150人的规模,他们就把它变成两个,再各自发展。“把 人群控制在150人以下似乎是管理人群的一个最佳和最有效的方式。”——150成为我们普遍公认的“我们可以与之保持社交关系的人数的最大值”。

我第一次对复杂网络有个感性的认识大概是大一的时候,当时雅虎中国出来一个很有趣儿的名人搜索(当然现在很多网站都有了),然后我就泡在上面折腾了个把小时。

复杂网络从数学的角度看自然离不开“图与网络分析”(插曲:我觉得运筹学是我学的最得心应手的数学课,几乎不用证明多好啊,直观的很容易理解,算法上的东西比定义上的容易搞定得多)。不过这里我们撇开数学不谈,看看复杂网络的应用(原文在此):

研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、 Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。

钱学森给出了复杂网络的一个较严格的定义:具有自组织自相似吸引子网络的内聚倾向)、小世界相互关系的数目可以很小但却能够连接世界的事实)、无标度中部分或全部性质的网络称为复杂网络。

看来看去,社会网络无疑是复杂网络应用中最好观测、最易直观理解的例子。

之所以提起来这个话题,主要是前几天无聊的时候翻了翻去年10月的一期《大众软件》,虽然其中《复杂网络——网络的科学》一文更多的是一种科普的角度来阐述复杂网络的概念,但是也并非没有分析上的启迪意义。复杂网络或许从数学工具的角度已经有比较成熟的框架和脉络,但是真正应用到社会学中,又是另外一番天地。经济学的研究现在特别讨厌弄个假设然后找个数学家来解题,毕竟我们研究的是人类的行为。

记得R会议之后Mr Liu曾发给我一篇沃顿商学院俩教授写的论文,原文载于Marketing Science,标题为New product diffusion with influences and imitators(谢谢tryshy订正)。可能从商业的角度看这篇文章有着自己的市场营销层面的价值,但是我感兴趣的则是里面利用的社会网络的分析方法。当时我是出于我理解中的微观经济学缺少一些人类行为层面的分析(我总觉得贝克尔在《人类行为的经济分析》里面只是分析了经济因素而非把行为本身作为一个决定模型的因素),也想多了解一些behavior economics方面的东西。从某种程度上来说,群体的行为必然是个人行为的加总,只是这个不能简简单单的是一个线性加法,而有着更多的决定因素和嵌套关系。

对于群体行为,心理学和社会学了解的要比经济学通透的多,他们的精华成果也颇为值得借鉴。我欲借复杂网络构建模型,却奈何对其理解不足,怕造成灾难性的错误,只得搁置。故而对于群体行为,即将撰写的博文中只会涉及正态分布和布朗运动,暂时放下复杂网络。或许有朝一日,对复杂网络的理解通透了之后,可以在两者之间构建一个桥梁,或许能看到一番新的景象。

Posted by cloudly

关于经济,一些要写的……

最近比较的慵懒,很多东西都只是简单的在脑子里闪一下却没有写出来。在这里简单的列一下,督促自己。

  • 凯恩斯传》的一系列感触。读完了快有一个星期了,再不趁热写估计自己就要忘得差不多了(不过估计写起来会没完没了)。
  • 群体行为和个人行为。做梦都在上社会学的课,囧。想试试用正态分布或者布朗运动来描述。
  • 时间维度。想把(有效)信息的传递(速度)作为一个衡量时间的单位,然后看看会不会有好玩的结果(至少很多模型里面可以引入信息的概念了)。

没想好是用中文还是英文写,但是理论上用英文写虽然时间要多花一点,不过收效也可能会大大出乎意料。只是我觉得再不写点东西我都不觉得自己像个经济学的学生了,看看近一个月的日志,除了那些跟计算机有关的就是灌水的,没多少正儿八经的有分析价值的东西。有些东西不写下来,时间一久就怕忘记了。

可能要把手头的那个小册子的“码字”停一停了,我真的有点"mentally tired",不想打开LyX……

另,感谢Hercy学姐特意发短信给我的学术信息,明日更新上

http://arxiv.org/

这是一个working paper大集合,有点像NBER那种感觉。JSTOR和arxiv其实都是归属IMS的,前者是三年之前的过刊,后者是04年后IMS的文章和一些已处理为印刷格式的文章(包括working paper)。里面有Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance and Statistics这个几个分类,也有相应的RSS可以订阅。建议大家配合利用Google Reader与最新学术信息保持同步使用。

如果大家还是找不准用哪个数据库,可以看看下面这个列表。不过其实我觉得,还是Google Scholar最好用……

http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines

要不是落园最近有些发神经,大家现在就能看到她的留言了。这位学姐可是非常的强悍啊,在强悍的山大数学院读着强悍的博士,拥有强悍的好学精神和对学术强悍的热情。最后,最难得的就是她不耻下问的精神,使得我有幸去彭实戈领头的那个金融研究院溜达了一圈,瞻仰了一下现代数学博士们的工作环境。

Posted by cloudly

Page 1 of 11812345...Last »

达则兼济天下,穷则独善其身。