【年末清仓】《物业经营管理》命题点全面解读 在线下载 pdf mobi 2025 epub 电子版
【年末清仓】《物业经营管理》命题点全面解读电子书下载地址
内容简介:
北京兴宏程建筑考试培训中心应广大应试者的迫切要求,组织了一批执业资格考试辅导名师组成物业管理师执业资格考试辅导用书编写委员会,通过这些考试辅导名师在具体辅导和命题工作中积累的经验,在全面锁定考纲教材变化、准确把握考试新动向的基础上,科学安排知识体系架构,以独特方法全方位剖析试题的真实含义,采用多维的解题方法拓展解题多思路的编写理念进行编写。
《2010全国物业管理师执业资格考试辅导用书》系列丛书的编写体例是:
命题规律解读通过辅导用书编写委员会对物业管理师执业资格考试的命题规律的准确定位,深度透视命题规律,帮助应试者理顺备考思路。
命题点解读一种话题就是一种考点,一段材料就是一段积累。辅导用书编写委员会将物业管理师执业资格考试的命题要点做了深层次的剖析和总结,帮助应试者有效形成基础知识的提高和升华。
热点试题全解辅导用书编写委员会在编写过程中,遵循考试大纲,结合考试教材,经过潜心研究、精心策划、重点筛选后编写出难易符合考试要求的典型试题,帮助应试者巩固已掌握的知识。
《2010全国物业管理师执业资格考试辅导用书》系列丛书的特点是:
“地毯式”搜索命题点——使考点插翅难飞;
“闪电式”速记命题点——把考试当作一场游戏;
“题库式”活用命题点——让命题者无计可施。
北京兴宏程建筑考试培训中心专门为应试者组成了强大的专家答疑团队,所有应试者都可以通过专家答疑邮箱(Kaoshidayi2009@163.com)提出问题,专家答疑团队接到提问后会在24小时内回答应试者的提问。我们更希望应试者通过邮箱给我们提出宝贵意见,以便我们在以后修订时更进一步提高辅导书的价值。
进入考场的那一瞬间,你可能会感到有点紧张,这很正常。放松你的心情,增加信心,我们相信你有能力也有把握将本次考试做到完美。
参加本书编写的人员主要有靳晓勇、张春霞、施殿宝、熊青青、李同庆、郑赛莲、周胜、郭爱云、郭玉忠、薛孝东、魏文彪、梁晓静、王凤宝、郭丽峰、乔改霞、孙静、黄贤英、张福芳、刘龙、杨自旭、范首臣、孙雪、彭菲等,在此特表感谢。
书籍目录:
考试相关情况说明
备考复习指南
答题方法解读
答题卡填涂技巧
章 物业经营管理概述
命题规律解读
命题点解读
热点试题全解
热点试题答案
第二章 房地产投资及其区位选择
命题规律解读
命题点解读
热点试题全解
热点试题答案
第三章 房地产投资分析技术
命题规律解读
命题点解读
热点试题全解
热点试题答案
第四章 收益性物业价值评估
命题规律解读
命题点解读
热点试题全解
热点试题答案
第五章 房地产市场与市场分析
命题规律解读
命题点解读
热点试题全解
热点试题答案
第六章 租赁管理
命题规律解读
命题点解读
热点试题全解
热点试题答案
第七章 成本管理
命题规律解读
命题点解读
热点试题全解
热点试题答案
第八章 合同与风险管理
命题规律解读
命题点解读
热点试题全解
热点试题答案
第九章 财务管理与绩效评价
命题规律解读
命题点解读
热点试题全解
热点试题答案
第十章 写字楼物业经营管理
命题规律解读
命题点解读
热点试题全解
热点试题答案
第十一章 零售商业物业经营管理
命题规律解读
命题点解读
热点试题全解
热点试题答案
第十二章 物业经营管理的未来发展
命题规律解读
命题点解读
热点试题全解
热点试题答案
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
《全国物业管理师执业资格考试辅导用书•〈物业经营管理〉命题点全面解读2010》命题规律的准确定位,深度透视命题规律,帮助应试者理顺备考思路。命题点解读一种话题就是一种考点,一段材料就是一段积累。辅导用书编写委员会将物业管理师执业资格考试的命题要点做了深层次的剖析和总结,帮助应试者有效形成基础知识的提高和升华。热点试题全解辅导用书编写委员会在编写过程中,遵循考试大纲,结合考试教材,经过潜心研究、精心策划、重点筛选后编写出难易符合考试要求的典型试题,帮助应试者巩固已掌握的知识。特点是:“地毯式”搜索命题点——使考点插翅难飞;“闪电式”速记命题点——把考试当作一场游戏;“题库式”活用命题点——让命题者无计可施。
精彩短评:
作者:小爽 发布时间:2020-01-31 16:36:58
内容很详实,很好的康复花园设计指导书
作者:撄宁 发布时间:2016-08-10 09:44:01
先储蓄后消费
作者:姜糖 发布时间:2024-03-09 18:14:39
餐后甜点。
作者:西尼可 发布时间:2023-04-25 21:55:47
书名很唬人,但其实只是花了绝大部分的篇幅论证了艺术对商业的重要性,最后算是安利了一下素描艺术吧~
作者:刀叢中的小詩 发布时间:2021-02-12 21:06:21
《裸体艺术》——裸像史。终于知道最后段誉和王姑娘为什么分开了,套用本书的话说,一个是无量山的“神仙姐姐”,一个是世俗的王姑娘,她们都在书里出现过裸体。万物生长都一样,好的皮囊,无不是基于爱或死而生的:爱,是始于美;死,却终于凝固——任何一个裸像,从来没有不唤起观众的零星情欲,即使是最微弱的念头。如果不是这样,它反而是最低劣的艺术,是最虚伪的道德。
作者:忒修斯之舟 发布时间:2010-05-09 21:11:23
本书讲述的,并非科学普及、也非科学哲学,而是“一位科学家的哲学”。这样一部激情洋溢的文集,其出版并非为了将科技前沿展现给普罗大众,而是为了向世人传达作者心中对于科学形象的描摹。“未知者可知”——这由先知七女传下的第一句箴言,也是作为一个科学家的惠勒其全部哲学的起点。这句话因其无法从理论上证明,因此不如说是一种信仰;然而这信仰如同欧氏的第五公设,正是划分两种世界观的界限:坚信这一点的,将能在科学的道路上不断迈进;而怀疑这一点的,最终势必将沉入神秘主义之海。以前总以为,相比于神秘主义的发人幽微,科学家们的信念往往显得质朴而执拗。而惠勒对于科学与存在的思索,无疑也贯彻着他坚定不移的科学信念;然而,这种科学信念体现在惠勒的身上,其深刻的思辨性,却毫不输于那些神秘主义的玄想。
深度书评:
《无限与视角》读书笔记
作者:Lowlibrarian 发布时间:2016-11-20 15:44:58
Karsten Harries以视角原理(principle of perspective)为主线,把世界看成一座剧场:你买了哪个位置的票,你就受这个位置所提供的视角的束缚。不过,事情也绝非仅此而已。一方面,Harries认为,要破除绝对的逻各斯中心主义所带来的价值、意义无涉,这容易遁入相对主义或虚无主义,技术与人性对抗;另一方面,像尼采式的“视角主义”也过于看低了理性与反思的作用,如果从主体中提炼不出任何普遍性的、适合所有人的东西,那么人与人之间便只是各说各话,没有可以公度的标准,主体上升到客观性之路受阻,后现代主义承诺了一种自由,却是一种可怕的终极自由。Harries同意布鲁门伯格对现代性的证成,对视角的反思必然使得人类能够意识到其他视角的存在,也就通过反思而超越了自身的视角本身。在此意义上,人类的太空旅行之梦需要返身回到地球呵护这个家园,唤起一种新的责任。(此书另外一个精彩的论述是,把现代性的发端上溯到中世纪,在天文学革命发生以前,唯名论就为新科学做好了准备。没有人类自身理解的转变,天文学革命就不可能被接纳。)
【中译本序】
由于技术的价值真空,产生了“技术不再辅助人性,而是可能剥夺人性,成为第二种本性”的担忧,因此与技术和地球达成一种恰当的关系很重要;精神的不安的根源在于“一种持续改变世界的【进步精神】。不断进步的技术开辟了无数超乎想象的可能性,但同时也可能使我们疏离自身”(p2),变动不居的世界潮流有可能给人们带来一种头脑晕眩之感,丧失确定性。
所以关键在于:我们既需要更多、更好的技术,又要负责任地使用技术。也即,要理解现代世界的正当性及其局限性。
视角原理(principle of perspective):“要把一个视角作为一个视角来思考,在某种意义上就已经超越了它,就已经认识到了它的局限”(p2)。对某一特定视角的意识必然伴随着对其他可能视角的意识。(从某种意义上来说,视角原理也就是价值中立的问题,在我们意识到自身是处于某种价值当中之时,我们就意识到了其他可能的价值,从而产生了跳出这种束缚自身的价值的要求,追求一种客观性。)
而科学在于回应了这样一种需求:
“自我能把自身提升到超越于最初束缚它的各种视角,这种能力要求作出越来越恰当的(即较少受视角束缚的)、在理想状况下真正客观的描述,从而要求一种越来越摆脱视角性扭曲的对实在的理解”(p3),追求真理要求自由,而自由的终极是理性无法把握的【无限】。
科学进步与人类中心主义:
“地心说与人类中心主义之间并无逻辑关联,这也意味着,科学上宇宙中心的必然丧失与生存论上人类中心的丧失之间并无逻辑关联”(p3)。追求真理需要“伊卡洛斯”(Icarus)式的飞翔,但是我们也知道单凭理性不足以为生活赋予意义。祛魅应使我们加深对我们脆弱地球的独特性的认识,无论如何地球仍然是我们生活世界的中心,所有意义均源出其中。由此需要一种“新的地心说”。
【第一章
导言:现代的问题】
对现代世界的不满可能导向两种方向:
一是怀旧——悲叹现代性对可靠位置、秩序井然的有限宇宙的摧毁,由此致力于修复或重建精神家园;二是认为现代世界把我们安顿得太好,“以致已成废墟的东西仍然充当着窒息自由的牢狱”(p2,后现代对建筑充满了怀疑,提防着空间宰制,废墟和牢狱则是非常诺斯替式的隐喻)。
后现代:
后现代“指向了某种模糊不清的‘他者’,指向了某个众所希冀的、即将到来的更光明的未来,即使它并未真正到来,即使其轮廓仍然晦暗不明”(p3);后现代主义并非晚于现代主义,这种对现代性缺乏正当性的怀疑在一开始就为现代世界投下了阴影;它怀疑逻各斯中心主义、欧洲中心论、现代科学。
后现代是“【拆解意义】”,巴塔耶认为,“建筑代表了一种囚禁我们的秩序,因此应当被摧毁,即使这种摧毁会带来混乱和兽性”(p4),自虐也在所不惜;这种对建筑的攻击(也是对意义的攻击)的前提是一种【诺斯替主义】欲望,“想要逃脱人的外形这一自由精神的监狱,即使这种解放的代价是失去一个人的头”(p6)。现代主义与后现代主义的问题归根结底是自由的问题(终极自由是可怕的,它以失去自身,也就是肉体来获得自由)。
自由与虚无:
自由似乎是追求真理的先决条件,但自由可能会继续提升自己,越过理性与真理,使那种追求本身受到质疑。这是自由的重负,自由的终极向度是不承认外在于自身的任何束缚。
不同意柯瓦雷所说的“现代科学既是这场精神革命的根源又是其成果”,只是其成果,精神革命的根源必须追溯到中世纪;只有人类的自我理解、对世界的理解先产生变革,才有可能接纳新的科学,而这种预先发生的人类自我理解的转变“是与对上帝、对上帝与人、对上帝与自然的关系的不断变化的理解密不可分的”(p15),现代科学和我们自己的文化是中世纪基督教文化自我演进的一个产物。
【第一部分 视角的力量与贫乏】
【第二章
视角和宇宙的无限】
用“视角”来贯穿新科学的历史前提,“它将把我们从【世界的无限性】引向【自我的无限性】,最终引向【上帝的无限性】”(p23)。
无中心的宇宙:
库萨的尼古拉宇宙论思辨的大胆之处在于把上帝的伪赫尔墨斯主义(psedo-Hermetic)特征转加给了宇宙:“一个中心无处不在、圆周处处不在的球体”(p25),该隐喻先于新天文学,“只有人类理解世界的方式发生了一种更加根本的转变,在知觉和思想上开启了新的可能性,那场革命才是可能的”(p34);库萨的尼古拉指出,“静止和运动是相对概念;被我们视为静止的东西取决于我们的视角”(p36),这种观念既削弱了中世纪的地心宇宙论,也趋于削弱即将出现的日心宇宙论,而朝着【无中心】前进。
宇宙的同质性:
库萨的尼古拉确信【宇宙的同质性】:每颗星星都是类似的,而这是寻找外星智慧的一个前提。所有星体都具有同等价值,由此“死亡和朽坏同样不是地球卑下的证据”(p40,由此其实是提升了地球的地位);“我们的世界经验被【碰巧】属于我们视角的东西所局限,我们不应认为这一视角使我们通达了事物的真相:还有无限多种其他可能的视角,每一种视角都对应一种可能的经验,人们在这些经验中都会把自己当作中心”(p41)。“有学识的无知”超越了日心说,超越了哥白尼。
【第三章
有学识的无知】
明白受视角局限让我们不再把现象误当成实在;库萨的尼古拉表明,我们在一切经验中都倾向于把自己置于中心,“亚里士多德及其继承者的地心宇宙论乃是依赖于一种【视角性的错觉】”(p45)。
不在场的实在:
真理要求客观性,客观性要求从特定的视角中解放出来,由此“对视角的反思导向了一种对【不可见的实在】的理解”(p47),实在本质上是不在场的。
词与物:
词语无法洞悉真正的存在,“对语言(或理智)与存在之间的这一基本裂隙的洞察是有学识的无知学说的核心”(p54);理智与真理的关系就像一个内接多边形与一个圆的关系;意识到语词仅仅提供了一个视角,就对超越语言的东西(实在的超越性)有了一种直觉。
有学识的无知不是怀疑论:
有学识的无知意味着我们永远无法摆脱有限,也无法理解上帝;但绝不意味着满足于我们理解力的局限,有学识的无知“要求我们朝着指导一切研究的超越的逻各斯开放,即使它始终是不可理解的”(p57)。
上帝作为绝对者超越对立:
在上帝那里,逻各斯与存在、语词与实在都是一致的;圆心与圆周相一致,“库萨的尼古拉希望通过【数学思辨】提供一个梯子,使我们能够瞥见上帝的无限性”(p61);这种关于【对立面一致】的学说指向了查拉图斯特拉的【永恒轮回】学说,上帝与万物同样接近,永恒实际上与整个时间共存;通过对对立面一致的认识,使得我们队无限有了一种直觉。
【第四章
阿尔贝蒂与透视建构】
对库萨的尼古拉来说,静止和运动是相对概念,绝对运动并不存在。空间渐渐被视为一个【无限场域】,人们试图通过把自己建构的点和线投射于空间来把握空间。阿尔贝蒂的透视建构(perspective construction)背后正是这种作为无限场域的空间观;于是“绘画所描绘的不是物体本身,而是其主观显现”(p69),所有显现都是相对于主体的看而言的。
这种透视建构本质上是人类中心主义的,因为人的身体提供了标尺和视点,人的理性提供了准则,这会遭到要求艺术以神为中心的人的批判。
【第五章
奇特的透视】
宗教对艺术的敌意:
“作为第二个造物主,艺术家有可能篡夺上帝的地位”(p86),而宗教反对此种偶像崇拜;柏拉图批评艺术是因为艺术只模仿事物的显现,而事物本身则是对理型的模仿,因此“艺术家三倍远离了实在”(p87);“以观看者为量度的人工透视必然意味着可见世界的世俗化”(p88),所以宗教艺术所面临的问题是:“因服从于透视而【切断了与超越性的联系】,但又试图用那种透视来体现超越性”(p88)。
艺术观与科学观的降格:
“我们正站在一种艺术观的门槛上,这种艺术观不再认为艺术作品是为真理服务的,而是将其降格为一种【娱乐】。同样,我们也站在一种科学观的门槛上,这种科学观不再要求科学适合于事物本身 ,而是满足于掌控表象”(p96)。
【第六章
阿里阿德涅之线】
人的机智试图纠正自然留下的缺陷,【望远镜】的发明加剧了这种傲慢;理性之光据说能使我们逃离迷宫,逃离世界的现象剧场;受制于视角的日常经验让位于科学描述,“阿里阿德涅之线是用数学编织而成的”(p125)。
科学的客观性与先验主体:
对真理的探寻要求我们寻找现象背后的实在;与此相关的一种想法是理性并未被囚禁在视角中,理性可以超越其初始的限制,与这样一位认知者相联系:“这位认知者没有被囚禁在身体之内,没有受制于感官,是一个【纯粹的主体】”(p130),所以客观性观念依赖于这样一个主体,绝对真理依赖于这样一个主体;现代科学根基的合法性就在于这样一个先验主体的合法性。
设想上帝的超越本身就是人类自我的超越:
把上帝设想为一位全能的、非视角的的认知者,这种想法的可能性本身便揭示了一种【自我超越的能力】,它是【反思】总的自我提升,“客观性理想与我们队真理的日常理解密不可分,其基础在于人类精神的自我超越或自我提升”(p131,作者有着很深的黑格尔背景)。
【第二部分 无限与真理】
【第七章
真理作为上帝的所有物】
对于上帝无限产生的两种不同的反应:
一是乐观主义的:人类自主、改造自然与世界;二是悲观主义的:信心受损,对认知的放弃(cognitive resignation)、自暴自弃。
由于一个共同的对手,基督教与新科学联姻:
尽管教会不愿接受理智的进步,但是“正是通过以神学的名义挑战亚里士多德的权威,保守派才为一种导向新科学的自然理解做好了准备”(p139)。因为,亚里士多德认为世界不可能比现在更大,也不可能存在任何其他世界,这使得上帝服从于自然的必然性,容易导向占星术式的星辰决定论;基督教(唯名论)为了【确保上帝的自由意志】,主张“全能的上帝本可以创造出一个完全不同的世界甚至是多个世界”(p141)。
唯名论导向的乐观与悲观:
“唯名论者强调上帝意志的首要性,是为了让人类理解【人与上帝之间的差异】。这种认识中暗含着某种认知上的谦卑甚至是放弃”(p149,【悲观】),“这种放弃的另一面是将人的想象力从其历史遗产(这里是亚里士多德的遗产)的重负中解放出来”(p149,【乐观】),这种放弃也是一种【降低标准】:愿意满足于某种算不上绝对真理的东西,“既然无望参透上帝创世的原因,我们就不得不满足于为自然运作所构造的模型”(p150),这也指向了笛卡儿转向机械模型的原因:我们只能在我们(无论在思想中还是在事实上)所能重构的程度上来理解事物。
关于无限的上帝与我们有限的知识分隔开来的鸿沟的沉思具有双重性:
一个后果是:“我们无法依靠自己的力量获得真理:人类认知者只有凭借神的恩典或馈赠才能获得真理。根据这种理解,把握真理的努力本身已经是罪的体现”(p155);另一个结果是:“发现人的精神中具有某种【与神相似】的东西”(p155)。
【第八章
空间的无限与人的无限】
18世纪提倡审美感受力,通过【崇高】来言说人对无限的某种认识,“在崇高的自然中,人认识到自己的崇高性,认识到在其中可以使自己超越一切有限的东西,从而与无限相接触”(p158),在崇高体验中超越一切纯粹现实的东西。彼特拉克的登山之旅成为一则隐喻,“空间的拓展成为精神无限拓展的一个隐喻”(p163)。但登山不仅使彼特拉克感受到了自我超越的能力,也激起了一种深刻的无家可归感,而想要回到那个家,则人必须转向上帝。
【第九章
人的无限与上帝的无限】
对此世的告别:
在埃克哈特大师那里,归家是【与这个世界告别】,“告别”(Abgeschiedenheit)暗示着离开这个世界。
作为神秘主义与新科学共同基础的【自我超越】:
【自我超越】是埃克哈特神秘主义的基础,它试图回到灵魂深处寻找神性,这种自我超越也是支配着【新科学客观性理想】的前提。客观性理想与一个纯粹主体的观念密不可分,用埃克哈特的话说,“该主体与一切位置同距离”(p174);人可以在反思中超越(视角的)限制;把上帝设想为一位全知、非视角性的认知者时,“人也表明自己能够设想这样一种理想认识,其中【认知与存在相一致】”(p174)。
人的两重存在:
埃克哈特大师在布道中反复强调这种观点:“人被描述为已经脱离了他的无限起源或无限自由,而落入了时间、空间和有限之中。但这种落入并不意味着我们的起源已被完全掩盖,它被体验为一种【召唤我们内转的东西】,使我们超越于有限的存在”(p183),人在本质上是受无限感召的有限造物;“自由就是超越当下的自我,只有这样,我才能把【我之可能是】与【我之所是】对立起来,将自我和我所遭遇的一切投射到可能性的无限空间之中”(p184)。
这有模糊人与上帝之间区别的倾向,但以下这一点使埃克哈特与异端区分开来:“并非自恋式地退回自我,而是蕴含着向上帝之光彻底敞开:对埃克哈特而言,重要的是神的逻各斯降临到灵魂之中”(p188)。
上帝无限与现代性的起源:
现代性的起源之一在于一种特别重视【上帝无限性的上帝观】。这种理解开启了一个深渊:“由于一切明确内容都被认为与上帝不相容,上帝渐渐被视为‘无名的不羁’。但一个变得如此不明确的上帝有【彻底消失】的危险。上帝成了一种【空洞的超越性】,无法为人类提供量度。对这一上帝的体验与对一种自由的体验无法区分,这种自由不承认任何量度,必将沦为一种纵容”(p196,pretty Gnostics!绝对的超越、绝对的异质、疏离将导致上帝在人间无所事事,上帝若无法为世间提供量度,量度就是人自身,这正是道成肉身的要义所在。)
这一发展的一个内在组成部分是【内转】,个人被抛回到他自身,内转为个人赋予了一种新的意义,即使它促使个人将其个体性遗弃在其内在的深渊中。“在中世纪的灵性中,我们看到了现代主体主义的一个根源”(p196),在14世纪看到的这种自由观与后来的【存在主义】提出的立场同样激进。
【第十章
工匠人:重新发现普罗泰戈拉】
由于与上帝之间的距离变得无限大,上帝不再能够充当受造物的量度,因此现在唯一可能拥有的量度似乎就是人这个认知者,由此我们回到了普罗泰戈拉(“人是万物的尺度”)。
在艾特哈特大师那里受造界是不可能有任何绝对的中心或量度的,这种反思易于导向无序(在政治上是无政府主义);但这种【去中心】引出了一个问题:“它不可避免会导致对一个【新的中心】、一种新的量度的需求……思考上帝无限性所导致的‘去中心’会引出一种人文主义的‘回到中心’”(p199)。
【第十一章 人的尊严】
在菲奇诺那里看到了一种恢复的信心,即人能够把握本质;而皮科远比菲奇诺更加鲜明地将【人的自由】与【宇宙的结构】对立起来,“宇宙不需要人来形成一个完美的整体。鉴于宇宙的完美性,人似乎是多余的”(p234)。他对人的尊严的称颂在于:他认为创造人类是上帝事后的想法,宇宙本身已是一件完美的艺术品,而人作为新的存在不可避免地会落在【宇宙秩序之外】,人具有了超越性。
【第三部分 地球的丧失】
【第十二章 哥白尼的人类中心主义】
虽然哥白尼对地心说的拒斥时常与对人类中心主义的拒斥联系在一起,但哥白尼本人似乎并未怀有这种想法:他消除了人类中心主义与地心说的关联,“身体给人指定的位置并不能真正为人定位。精神是自由的”(p249,所以人类身体所附着的地球处于何种位置,并不与人类的本质自由真正相关,人类的本质自由与人的精神相关。);《创世纪》第一章中把自然看成资源和原料来源,这为人类统治万物的大开发企图提供了根源。
【第十三章 布鲁诺的罪行】
“布鲁诺追随库萨的尼古拉,使哥白尼那个虽然放大许多但仍然有限的宇宙迅速扩大”(p271);布鲁诺被教会指控为异端的原因在于:他的宇宙观会导致宇宙中没有优先位置,地球肯定不具有优先位置,所以道成肉身就不必然是针对地球的;布鲁诺的循环历史观也不可能与基督教的历史观调和起来;布鲁诺按照Lovejoy所称的那种“丰饶原则”(principle of plenitude),拒斥了唯意志论和世界的偶然性:“创造只可能是现在这个样子。宇宙渐渐被理解为上帝完全恰当的自我复制。因此,创造是无限的上帝本质的【必然】展开。这种观点没有人格造物主的位置”(p281),由此道成肉身也没有必要。
罗森茨威格(Rosenzweig)认为,【无穷多个世界】的观点与所有启示宗教都不相容,布鲁诺的宇宙观与赫尔墨斯主义泛灵论密切相关,这导致了【对宇宙的神化】,“曾经留给上帝的形容词现在用来描述宇宙:它现在被说成是必然的”(p282)。
【第十四章 伽利略的洞见与盲目】
重要的是望远镜的发明;“借助于仪器,我们现代人看到了更多的东西。堕落已被技术发明所撤销”(p286);但是,望远镜无法满足期望:“当距离被克服时,还会出现新的更大的距离;这种仪器非但不会带来新的安全,反而会增加不安全感”(p287-288);于是望远镜的发明的前提是意识到【我们眼睛的不完善】,我们现在可见的只是潜在可见的一小部分——还要相信眼睛的现况是可纠正的,这导致了【人的本性可以纠正】的观点,这种【对进步的信仰】帮助塑造了现代世界。
望远镜大大增加了恒星的数目,“这极大地促进了【实际世界】与【可见世界】的逐渐分离”(p289),可见世界成了潜在可见世界中的一个岛屿。而伽利略是乐观的:“在伽利略看来,宇宙的同质性首先意味着地球从它之前的卑贱地位提升至星体层次”(p290);中世纪的宇宙观是“以魔鬼为中心的”(diabolocentric),对于一个亚里士多德主义的基督徒来说,“上”意味着更好,伽利略认为自己是在反对魔鬼中心主义。
【第十五章 无限的暗礁】
新科学不仅是依赖培根所说的经验,还要依赖数学,“新科学的道路必须介于培根的经验主义与这种柏拉图主义之间”(p307);新科学“掩盖了胡塞尔所说的生活世界,极大地【缩减了经验和存在】,使科学真理的领域没有为意义或价值留出任何位置”(p309)。在无限这块暗礁上,笛卡儿的方案——只承认完全已知且无可怀疑的东西为真——失败了;我们不得不满足于“盖然确定的”东西;笛卡儿的上帝观始终接近于唯名论者;笛卡儿指向了意志,“自我超越了它自身的理解力。任何自由活动都显示了人的自我超越性。一切人类行为就其是自由的而言最终都是【不可理解的】”(p320)。
【第十六章 哥白尼革命】
启蒙运动代表者兰伯特(Johann Heinrich Lambert)认为,“我们也许仍然不够哥白尼(Copernican)……我们仍然需要从既有的视角和偏见中解放出来,这是一项尚未完成的任务”(p326);笛卡儿已经在追求客观性的路上转向了一个【纯粹的先验主体】,“思想者从中排除了偶然的个人、位置和时间,以确保一种真正客观的自然认识”(p328)。
第三次哥白尼革命:
如果把康德的革命称为第二次哥白尼革命(正如眼睛无法看到客观实在,认知也无法把握事物本身或物自体),第三次哥白尼革命就是认为:笛卡儿或康德错误地相信有一个纯粹的认识主体,能在把握客体的同时避免一切扭曲或主观扭曲。第三次哥白尼革命的一个核心主题就是【对语言和历史的反思】;罗兰·巴特认为,摆脱主体偏见是不可能的;海德格尔宣称,那种(康德、笛卡儿等)通过纯粹主体观念来为认识客体的可能性奠基,为科学的客观性奠基,“哲学家不正当地利用了其神学先驱”(p330);由此,为了比康德更具批判性,“我们就不得不把主体和逻各斯都沉浸在世界之中,使二者都受制于时间”(p331)。
在这一波浪潮中,随着现代性在认知上的人类中心主义遭到破坏,并且不再声言真理(尼采),可以说现代性已经结束了。罗蒂(Rorty)《自然之镜》表达了所谓第三次哥白尼革命;这种观点认为:我们只能认识现象,但暗示有可能超越这些现象更好地把握实在;实在与可见世界分离。
哥白尼式反思(第三次哥白尼革命恰恰反对它)是对经验的双重还原:
这种对实在的现代理解,依赖于对经验的双重还原。
第一重还原:试图把思想从这些太过个人的兴趣和视角中解放出来,即:把意义与可感事物分离开来,“自我摆脱了世界的约束,成为不偏不倚的观察者”(p334),其代价是将意义从世界中驱逐出去(价值中立);
第二重还原:把可感事物与实在分离开来。身体为我们制定的视角并不是一座监狱,我们可以通过数学来尽可能摆脱特定的视角和视点进行描述。
第三次哥白尼革命是反对那种哥白尼式信念(即:人能够把握实在本身)的,对视角的反思必然反对一切认知上的乐观主义;这种后现代式的人文主义”将其自身从现代逻各斯中心主义中解放了出来,使理论变得更加有趣,使它比起工作更像是娱乐”(p335)。
但是,这种超越逻各斯中心主义的人文主义要想发挥真正的作用,就必须理解科学的正当性和现代的正当性;“事物永远不会把它们本身呈现给我们,而只会提供其视角性显现”(后现代所鼓吹的),并不意味着“我们不能要求客观性,不能有标准来区分客观性程度的强弱”(p336,有偏见不代表不可以追求客观性);第三次哥白尼革命并没有足够认真地对待【反思的力量】(作者提出了对后现代的批评);“指导现代科学的客观性理想的根基就在于传统的【真理符合论】。它与人类精神的自我超越和自我提升密不可分”(p337);由此作者诉诸了一种黑格尔式的反思所具有的超越力量对客观性的证成:“现代性之所以将其自身解释为一切历史都趋向于它的一种文化,不仅仅是出于沙文主义偏见或盲目的力量。黑格尔不无道理地坚持认为,反思之中存在着进步,这种进步帮助塑造了历史的进程”(p337)。
如何对待技术:
追求客观性的代价似乎是意义的丧失,也即容易遁入虚无主义;技术的确是一种危险的力量,“有可能将其接触到的一切(包括人类在内)都还原为由技术规划加以组织的物质材料”(p338),但是,这种还原【是一种趋势,而不是我们必须屈从的命运】(面对技术重要的是认识到其双面性,承认其价值中空,人类运用它时要承担责任,而不是放弃技术)。“我们只能尽力提醒技术注意自己的位置:我们必须肯定它,甚至欢迎它,但同时又要与之保持距离”(p339);要克服傲慢之罪,僭越上帝的位置的那种傲慢之罪;这种傲慢之罪的另一面是“我们无法接受自己是脆弱的凡人,而不是自身存在的主人”(p339),傲慢是虚无主义的根源,它会剥夺存在的价值,我们必须正视自身的软弱。需要的是一种并非源于傲慢的存在论:“这种存在论将会意识到,追求真理以一种人类永远无法达到的理想为量度,追求真理要求有一种客观性,即使我们永远无法达到完全客观”(p340),克服虚无主义要以敬畏、尤其是对地球及其居民的敬畏为前提。
【第十七章 尾声:宇宙航行学(Astronautics)和宇宙心智学(Astronoetics)】
宇宙心智学的必要:
宇宙心智学出现于Hans Blumenberg(布鲁门伯格)的《星星的悉数性》(Die Vollzähligkeit der Sterne);“宇宙航行学似乎已经使宇宙心智学变得无关紧要,就像科学的进步似乎已经使哲学变得无关紧要一样”(p343),但是宇宙心智学也意味着深入思考【是否要去】那里旅行,以及这种旅行【是否有意义】;宇宙心智学也会出现在宇宙航行学之后对其进行反思,而不单单是一种出现在其之前的淘汰产品。
“被留在家里的人”:
宇宙航行学把我们留在家中,离家的自由之梦乃是诺斯替主义的梦想,“它把这个世界看成一个拒不满足我们最深切愿望的世界,看成一座监狱,而根本不是家”(p344),当今就是一种典型的【后现代的诺斯替主义】,梦想从这个世界中得救,梦想回到“彼岸”(other),布鲁门伯格帮助我们避免被此种彼岸之梦所诱惑。宇宙心智学帮助我们思考飞行,而不受诱惑离开地球,而是让这个地球显得更加珍贵、更像家。
宇宙冷漠:
宇宙不为人所造、其被造也不是为了能被人认知,这种宇宙冷漠导致了虚无主义,“【现代主义】怀恋那个业已丧失的中心,而【后现代主义】则拒绝一切所谓的中心,这种拒绝伴随着对一种前所未闻的自由的承诺”(p347)。
太空探索的两种相互矛盾的渴望:
“一方面是渴望崇高,渴望兴奋地遇到【某种完全不同的东西】,这种兴奋源于一种【诺斯替主义】渴望,即超越这个【太过熟悉的世界】到达彼岸;另一方面则是渴望美好、渴望在那里遇到像我们一样的智能生命,从而不再迷失于太空,在这个大大扩展的宇宙中再次感受到家的感觉”(p348);而关键在于精神本身:“只要我们在自己的世界中没有体验到精神的化身,我们在其中就不可能有家的感觉”(p349)。
布鲁门伯格与后现代主义者之间有深刻的分歧,后现代主义者“他们会让我们跳入水中,不是为了前往一条新船,而是因为他们迷恋游泳者的自由,所以让我们放弃舒适的家”(p352);人类的好奇心会使得人失去家园,与之伴随的是【认知者自身主体性的丧失】:“眼看着它的生活时间(lifetime)变成多个生活时间中的一个,即世界时间(world-time),从而与自身相疏离”(p353),这需要宇宙心智学来提供一种全新的后现代地心说,宇宙航行的意义在于人类通过视角的自我超越来彻底认识自身。
Study Notes
作者:S.Z 发布时间:2019-09-09 14:35:12
简单的一些笔记,如有错误欢迎指正
“机器学习”这个概念其实有些误导:机器不能学习。而且机器学习的目标“仅仅”是基于训练样本尽可能对训练集外的“大多数”样本作出正确的预测,而且,训练集外用于预测的样本于训练时使用的样本应该是“有着类似的统计分布特征”(可惜在实践中,尤其是金融行业,我们太经常会忽略对于训练集的划分以及对于样本统计分布变化的考量了)。
其实对于遇到的很多问题,首先要问的是该问题是否适合机器学习模型来解决,如果适合,再分析应该采用哪一类模型(现实中,太多的人轻视原始问题的业务分析和技术适用场景,看到新潮的技术不管三七二十一就上马试试,拿到看似美丽的结果就上生产,结果遇到很多坑)。
机器学习的学习在业内目前一般分为四类:①监督学习;②半监督学习;③无监督学习;④强化学习;
半监督学习是在训练集里混合带标签与不带标签的两类样本,对于机器学习来说,这样带来的信息增量益处在适当处理下能够远超训练数据复杂度带来的拖累(从定义简单逻辑上看,半监督学习是不是能从逻辑上简化为首先使用无监督学习对不带标签的样本进行分类再对分类结果进行监督学习)。
强化学习对于环境的“状态(state)”敏感,可以针对不同的环境状态作不同的决策,因此和其他的机器学习模型区分比较明显,而且似乎强化学习更适合用于金融行业的决策。
支持向量机将N维特征向量投射到一个虚拟的N维空间,并作一条虚拟的N-1维直线将不同的结果划分开,这条直线被称为决策边界decision boundary。
向量vector是有序的,所以有index取值,但集合set是无序而且唯一的,所以python里对于一些元素取唯一值的函数就是set(是不是一般来说机器学习的输出范围都应该是一个set)。
max与arg max对比:后者返回使函数值最大的自变量值。
Model-Based是一般常见的机器学习算法,训练完成后训练集数据即可丢弃,而Instance-Based算法典型的是KNN算法,利用最邻近的样本数据作为标准输出结果,因此训练数据将一直保留。
基础的机器学习算法包括(不包括深度学习算法):
线性回归:简单,而且极少过拟合(两个特征其实应该差不多是一回事,简单的模型一般都不容易过拟合),损失函数用最小二乘法,原因主要是方便计算,因为二次项的一阶导便于计算。
逻辑回归:其实逻辑回归不算是回归,而是一个分类器,只是在函数看起来比较像线性回归而已,相当于在线性回归输出端叠加一个转换函数,一般就是sigmoid函数(也称为标准逻辑函数standard logistic function),他的损失函数用“最大概率”作为标准。
决策树:通过每一个节点的输出来判断下一个节点的方向,比较基础的一种叫ID3(目前常用的决策树模型是C4.5),损失函数与逻辑回归看起来非常相似,不同的地方在于逻辑回归是带参数的模型,而决策树返回的是一个无参数模型。
可接受离散和连续变量;
解决不完备样本(incomplete examples)问题;
通过剪枝(pruning)解决过拟合问题;
支持向量机:SVM通过满yi(xi*w-b)-1>=0来实现划分,再通过min ½ (||w||)**2来尽量使决策边界离两个子集的边界样本距离相等。如果样本中混合了噪音,引入hinge loss函数max(0, 1-yi(w*xi-b))来惩罚,引入这一函数的SVM称为soft-margin SVM而原始的版本就称为hard-margin SVM。最终SVM的目标函数就成了:
C是超参数,用于权衡泛化能力和拟合水平,C越高,对于维度的惩罚越重要,因此泛化能力越好,C越小则反之,对于噪音的惩罚越大,结果拟合度越高。
对于某些样本在低维度上SVM不能很好划分时,可以使用隐含mapping提升维度,在高维度寻求决策边界,这种方法称为kernel trick。
K邻算法:模型保留所有的训练数据,是一个非参数模型。计算间距时,常用的是Euclidean distance,另外一种常用的算法是cosine similarity(测量的是两个向量方向的相似程度,正交时值为0,相反时值为-1,所以如果作为距离函数需要将该值乘以-1):
机器学习模型一般包括以下三个部分:
损失函数loss function;
基于损失函数的优化标准;
基于训练集寻找优化结果的优化路径optimization route;
对于像线性回归、逻辑回归以及SVM来说,优化标准都是显性explicitly的,但决策树和kNN算法是最古老的机器学习算法,当时是基于人的直觉建立的,没有显性优化标准。
梯度下降gradient descent和随机梯度下降stochastic gradient descent是常用的优化算法,应用于优化标准是可微的场景,得出的结果是局部最优的local minimum,但对于像逻辑回归以及SVM这类问题,优化标准是凸的convex,局部最优也即全局最优。
线性回归由于是封闭解问题,因此可直接解不需要通过梯度下降来优化求解。
分类器算法中,SVM和kNN返回的是分类,而逻辑回归以及决策数可以返回一个概率值。
特征向量中如果包含类别数据,一般转化成为one-hot encoding(即我们之间称为dummy factors),不使用1/2/3等数字编码是为了避免其排序干扰学习。相对应的,另外还有一种有序分类(分组)称为binning或bucketing,但在分组完成后还是转化成one-hot encoding格式(这个不是很理解,因为似乎这样损失了排序信息)。
特征值的标准化分两类normalization和standardization,使用哪种需要分析人员自己判断,一般来说如果有充足的资源的话可对比两种方法,采用较优的,如果资源不足,一种简单的判断标准是①非监督学习一般用standardization更好;②如果特征值类似于正态分布则最好使用和standardization;③如果存在特别极端的极值,则最好使用和standardization;除前述情况外,一般可以使用类normalization。
缺失值处理:
删除包含缺失值的样本,适用于样本量足够大的情况;
选择能够较好处理缺失值的学习算法模型;
数值插补:
直接用非空样本的简单算术平均;
使用极值插补,例如一个正常取值为[0,1]的,使用-1或2插补;
使用中间值插补,例如中位数(这和第一条类似);
使用回归等方法从其他特征值学习预测(BARRA使用);
新增dummy factor用于标记空值,再将空值置0;
算法模型选择(有足够资源应该尽可能多尝试对比,资源有限时考虑):
可解释性explainability:如果业务需求是需要将算法的预测向非技术人员解释的,那么可能最好使用类似于kNN、线性回归以及决策树等算法,尽管看起来拟合度会差一些,但解释预测逻辑比较直观。相比之下,像神经网络以及集成模型Ensemble Model在拟合上明显有优势,但是个黑箱,很难进行逻辑解释。
内存加载in-memory vs. out-of memory:如果数据可以完全加载到内存的话,基本上所有算法模型都适用,但是如果数据集过大,就需要考虑使用增量学习模型incremental learning algorithms。
特征与样本的数量:神经网络和gradient boosting等模型可以应付特征与样本数量非常巨大的场景,但SVM相对应用的维度要低很多。
特征类别(数值型 vs.类型):有一些学习模型对于数据的类别敏感,可能不能应用于类别数据,需要分析师进行转化。
数据的非线性:对于线性可分的样本学习,SVM(linear kernel)、逻辑回归以及线性回归是很好的选择,否则的话可能需要使用深度神经网络或者集成模型Ensemble Model。
训练速度:训练速度取决于模型的特征,目前的程度包基本都实现了模型的最优算法,需要结合分析人员硬件的特征选择最合适的算法,比如随机森林就可以利用CPU的多核特性来加快训练速度,(而深度神经网络训练速度的提升众所周知可以利用GPU的特性)。
预测速度:一般考虑业务在生产环境下的预测速度是否能满足实际需求。比如像SVM、线性回归以及逻辑回归等算法,学习完成后进行预测速度很快,而像kNN、集成模型以及深度神经网络或RNN在预测速度上相对较慢(不过目前较新的程度包应该能实现kNN和集成模型较快的预测速度)。
另外:scikit-learn提供了算法选择图供参考
数据集的划分:一般分成三部分(训练集、验证集和测试集),训练集用于训练模型,验证集用来验证选择最合适的模型和超参数,测试集是在生产应用前的最后验证。三个数据集的比例传统上是70%/15%/15%,但在大数据时代可采用95%/2.5%/2.5%。
Bias是指模型对训练样本的拟合程度,而variance是模型对训练集的敏感程度,两者存在此消彼涨的关系。一般来说过低的bias/过高的variance是过拟合,即使是简单的模型比如线性回归也可能过拟合(例如维度高于样本数量),常用的缓解过拟合的方法是regularization正则化。
与我们在neut过程中的正交不同,机器学习中的正则化是指在目标函数中引入对过拟合(模型复杂度)的惩罚项,常用的正则化方法有L1和L2(线性回归中引入L1正则化的也被称为Lasso,引入L2正则化的称为Ridge岭回归)。也可以将L1和L2正则化一起使用称为elastic net正则化。除此之外,还可以使用dropout以及batch-normalization以及非统计方法data augmentation以及early stopping。
回归模型的评价标准可以用MSE(mean squared error)来衡量,如果发现测试集的MSE显著高于训练集时那么可能是因为过拟合了。
对于分类模型的评价标准一般有:
混淆矩阵confusion martix:是一个基础版本的统计,用于观察分类中正确与否的统计量,并可用于后续计算其他评价指标;
准确率precision/召回率recall(很难同时兼顾准确率与召回率,必须进行取舍):
准确率 = TP / (TP+FP) 对于所有正类预测中正确的比例;
召回率 = TP / (TP+FN)对所有实际正类的预测召回的比例;
正确率accuracy(注意和准确率的区别) = (TP + TN) / ALL,当预测正确(无论是正类或者负类)同样重要时,用正确率能更好衡量模型的效果;
加权正确率cost-sensitive accuracy:对于基础正确率指标中的分子进行系数处理,以体现不同正确预测的相对重要性;
AUC(Area under the ROC Curve):ROC for receiver operating characteristic,简单说来算法就是根据二维坐标,横轴是FPR(FP/(FP+TN)),纵轴是TPR(TP/(TP+FN)),根据不同的门槛参数计算以后划出一条切分一个[0,1]正方形的对角线,看对角线下方的面积大小,越大代表模型的分类效果越好。
超参数的调参:基础的是grid search,常见的是指数法,比如[0.001,0.01,0.1,1,10,100,100],基于训练集训练完后再使用验证集看哪套超参数效果最好,测试完成后,还可以在最优超参数的基础上调高精度再叠加一次测试。也可以不穷举测试的超参数列表,而是给出该参数的分布参数以及数量,让机器自动随机生成测试,称为random search。还可以参考之前超参数的有效性来生成下一个测试超参数的Bayesian hyperparameter optimization。最后,还有gradient-based techniques以及evolutionary optimization techniques等等。
如果没有足够的验证集来调试超参数,可以使用交叉验证法cross-validation:对于给定的一组超参数,将训练集随机拆分成N组(一般是5),对每N-1组作为训练,剩下的作为验证,一共验证5次,将5次验证指标平均作为该超参数的指标。
在神经网络中每一个神经元unit计算时都是线性的,只是在激活函数时可进行一系列的非线性变换(这也和大量机器学习领域的专业人士对于线性基石作用的认可相符合)。
一般情况下同一层的神经网络单元共用一个激活函数,但也有例外。
神经网络模型通过最后一层的激活函数类型来区分是分类器还是回归模型。
建立模型时可以尝试任何激活函数,只要该函数是可微的(或者在大部分定义域上是可微的,比如ReLU函数在0处不可微,但经常用来作激活函数)。
如果激活函数也是线性的话,那么整体个神经网络也是线性的(线性叠加保持线性),而为了更好拟合问题的非线性特征,激活函数通常是非线性的。常用的除了logistic(取0或1)以外,还有tanh和relu,前者取值范围是(-1,+1),后者小于0时返回0,其余则返回原值。
深度学习定义为超过2个非输出层的神经网络。过去深度学习的困境主要在vanishing gradient,这现象会导致深层网络的最左侧训练非常缓慢(梯度下降幅度不足,不够敏感),但现在的技术大大提升了训练的速度,因此深度学习的应用才有了大的突破。
卷积神经网络CNN在建立的时候就主要是针对图像识别问题,他解决了传统神经网络中当维度过高时训练参数过多的困难。
初级的卷积神经网络可以扩展成带体积volume的卷积神经网络,同时也可以进行stride和padding(更好学习图像的边缘特征)来训练。
pooling是使用固定的函数(比如max来替代原来的过滤操作),训练的超参数包括stride和pooling大小(常用的stride是2,常用的filter大小是2、3,max函数一般认为效果最好)。
为了缓解RNN在长时间序列上的遗忘性,实践中使用gated RNNs,包括LSTM(long short-term memory)和GRU(gated recurrent unit)。
当简单的线性拟合效果不佳时,可引入非线性方程比如二次方程,搭配梯度下降寻求最优参数。但当维度高于3时,这样的方法也会面临困难。比较好的解决方式是使用无参数的Kernel Regression。
大多数分类器都可以扩展成为多类别的分类器,但如果无法扩展,可以将原始数据集重分类为N个样本,学习N个二元分类器,再选择分类确定性最高的结果。
one-class分类问题不是指二元分类,而是指学习样本全部属于一个特定分类,而没有对照组(或者更少),因此更难学习。这类问题主要应用于异常检测,比如看是安全网络内设备是否受到攻击等。常用的模型包括:
one-class高斯:学习一个能最好描述训练集的高斯分布密度函数,再根据新样本的分布概率密度对比某一个值判断是否异常。如果单一高斯分布无法很好描述样本数据,也可以使用mix混合高斯来解决。
one-class K-means和one-class kNN:与前面高斯的类似,也是先建模描述正常样本,再将新样本与模型对比,超过一定界限认定为异常。
one-class SVM
早前章节介绍的许多模型在实际应用中都有些过于简单了,而想要使用复杂的模型对于训练数据的量要求可能过高,我们无法获取足够的训练样本。因此,相对于训练出一个理想的单一模型,我们可以使用多个简单模型再将他们的结果综合成一个meta-model,称为集成学习ensemble learning(这种方法在FAJ上见到有人介绍过,结果似乎还行)。两种最常用的集成学习方法是:
boosting:使用一个样本不断生成新模型针对原有的缺陷进行学习。常用的比如gradient boosting,首先有初始模型预测值,再将样本标签与预测值残值residual作为新的标签进行学习,不断进行这个步骤直到达到预设次数。
bagging:随机拆分样本进行学习,再综合。随机森林是应用最广的集成学习,而且内在机制也尽量排除相关性的干扰。
从描述上看也可以看到boosting减少bias,可能会过拟合,而bagging则减少variance。
文本处理上除了RNN以外,目前还有一种很有效的方法Conditional Random Fields。
将原始版本的sequence labeling问题泛化以后就是seq2seq问题,这类问题的x和y可能长度不同,典型的就是机器翻译问题、文本总结以及文本纠错等。目前业内认为最适合的模型是神经网络,该网络要包含编码encoder和解码decoder两部分功能。
主动学习active learning针对的是学习样本中标签成本过高的问题,比如在医疗和金融领域,相关的标签不是那么客观直接,需要专家的意见。此时,使用主动学习可以只使用训练集中少量标签数据,并标注其他非标签样本中对模型质量贡献最大的样本数据(并非全部标注)。实用领域的主动学习一般分成两类:
基于数据密度和不确定性的方法:这种方法首先基于有标签的数据进行训练,将初级模型应用于其他无标签数据(可全部也可随机选择),应用后对该部分数据会有一个重要性分值(importance score),该分值分为两部分:数据密度(用样本与邻居的距离衡量,因此密度越低重要性越高)以及不确定性。对于重要性分值高的样本(即密度越低,即本身越有个性,而且不确定性越大的样本),挑出来进行专家打标签,然后重复前述步骤直至达到某一个预设标准。
基于支持向量的方法:看描述和前一个的一部分是一样的,就是用带标签数据训练一个SVM模型,再基于该模型将最接近分界线的样本交由专家打标签。
委员会方法query by committee:是一种综合的方法,是将多个基于标签数据模型对无标签数据进行标记,将分歧最大的样本交给专家打标签。
半监督学习针对的和前述类似是训练样本中并不是所有都带标签的数据,目标是尽可能在不增加标签要求的前提下提升模型效果。目前业内没有公认的最优方法,常用的有:
self-learning自学习:和前面主动学习里找出最不确定的提交给专家打标签相反,自学习是在基于标签样本训练模型应用后,对确定性高于某一临界值的样本自动标记,并循环直至连续N次都无法提升模型效果。这个方法在很多时候效果不佳,甚至会降低模型效果,因为该方法对于训练样本的统计分布特征有一定要求。
业内对于识别手写数据的机器学习算法公认最有效的目前是ladder network,它包含了一个沙漏状的编码解码结构,而且还引入了噪音训练(训练完成后的实际预测时不再加入噪音)。
聚类法也是一种直观的半监督学习方法,即先将样本聚类,再根据所属类别中标签众值对数据进行标记。
S3VM则是对无标签样本的众多可能标签均进行SVM学习,然后选择效果最好的那组标签,至于标签候选组合的选取可参见相关学术文献。
one-shot learning不是指学习时只用一组对比样本即可,而是指最常用的应用场景(人脸 识别)中只需要你本人的一张照片作为基准即可,训练时依然需要大量样本数据,尽管相对于其他学习问题,此类问题的样本分布不对称(照片不匹配的样本容易获得,而匹配的样本相对少很多)。目前业内主流的学习模型是Siamese神经网络(暹罗的意思,不知道和猫有什么关系),这种网络主要特征是将一组样本(基准、真对照、伪对照)并列,计算损失函数时同时考虑真伪两种情况,而训练的基础embedding模型则可根据样本特征选择不同的方法,比如CNN、RNN或者MLP。学习过程中,一般在前几批次学习过后,深化学习时只选择那些模型看起来很难区分的伪对照,以便模型尽快脱离学习舒适区,提高学习效率。
zero-shot learning是一个很新的领域,目前相关研究都还不太成熟。
样本数据不均衡处理(决策树、随机森林以及梯度下降模型对不均衡样本相对不敏感):
对于一些分类问题,如果某些分类的占比过低,而对其分类要求又很高的话可以在损失函数上对其增加权重,比如某些SVM算法就支持对不同的分类配置不同的权重。
over-sampling,即人为的拷贝少数分类样本扩充其比例。
undersampling,和前面相对应,随机剔除一部分多数分类样本来实现样本均衡。
synthetic补充,即根据占少数分类的样本特征值生成新样本扩充原有数据集,常用的算法有synthetic minority oversampling technique(SMOTE)和adaptive synthetic sampling method(ADASYN)。两种算法比较相似,基本逻辑是从少数派分类样本中选一个基点,再根据它邻近N个样本(从全样本中选,不仅仅是少数派)中再随机选一个样本,将该样本与基准样本的偏离量乘一个系数加到基准点上,生成一个新的样本。ADASYN模型的特殊之处在于,最后一步生成合成样本的数量,与N邻样本中非少数派数量成正比,因此均衡机制更为积极。
combining models:像随机森林这样的集成模型本身就综合了多个小模型,但都是弱学习模型而且属于同一类型,数量比较多。我们也可以将几个比较高级的强学习模型进行综合,但数量保持在2到3个为宜。将多个模型组合在一起的假设是需要各个模型之间相关性比较弱,如果只是将同类不同超参数的模型进行组合可能效果不佳。综合的方法包括:
平均法:用于回归模型以及输出是分类值的分类器。
多数法:用于分类器,选最多的分类结果(如果并列可以随机选或者返回异常)。
堆积法stacking:其实可能叫管道法更形象,是将一个模型的输出作为另外一个模型的输入。
transfer learning:一般的用法是将embedding层后面的部分替换成新的层,同时在保持前面部分参数不变的前提下训练模型以适应新的样本。
无监督学习:
密度估计density estimation:经常用于估计样本所属数据集的分布参数,主要应用在异常监测上。
聚类clustering算法:
K-Means:有一个超参数N用于确定分组数量,然后随机选N个起始点作为centroids,再将其他样本分别划至最近的centroid所属分组,再将该组内特征值的平均作为新的为centroids,不断重复前述步骤,直至样本所属分组不再变动。这个算法有可能出现不同起点导致不同分组结果的现象。
DBSCAN和HDBSCAN:DBSCAN有两个超参数,他不再需要人为确定分组数量,而是先选一个起点,将距离小于超参数a的样本划入该分组,再对分组内的每一个样本扫描a距离内的样本,如果数量超过超参数N,将该部分纳入现有分组。然后再分组外再重新选一个起点重复该步骤,直到所有样本均被分组。而HDBSCAN针对DBSCAN的缺陷,用一些巧妙的算法可以动态调整超参数a值,因此不需要人为训练,而且也能应对分布密度变化的问题。
聚类算法分组数量N的选择:可以将训练数据拆分成两份,类似于训练和验证集,然后各自按N分组,再将两者的结果作一个矩阵交叉验证,也可以使用一个比较正式的差异计算公式来判断匹配程度。
如果每个样本只能属于单一分组,则是hard clustering,此外还有Gaussian mixture model可以在过程中使用加权平均来实现同一样本属于不同分组。HDBSCAN也可以实现单样本不同分组的目的。
降维dimensionality reduction:
过去降维的目的是加快运算速度,减少对算力的压力。但随着算法的进步以及硬件的提升(尤其是GPU计算对机器学习的加持),目前降维的目的主要是方便人类进行数据可视化(人类只能处理三维图像)。我觉得可视化有助于人类发现其中的模式,进一步优化机器学习的效果。
另外,当你的算法被限制在一些黑盒化比较弱(可解释性强)的算法时,算法对于数据维度要求比较严格,因此也必须借助于降维来实现。
常用的降维算法包括PCA主成分分析以及UMAP(uniform manifold approximation and projection)还有auto-encoders。
排序优化问题:
pointwise:即将多个排序问题拆解成大量点问题,转换成传统的监督学习,但效果非常一般。
pairwise:即将多个排序问题拆解成多个配对对比问题,输出这对点相互大小。这种方法比前一种效果有所提升但还远远不够。
listwise:目前主流的算法,典型的包括LambdaMART,利用直接优化排序结果的一个评价函数来实现,常见的评价函数是MAP(mean average precision).
推荐算法learning to recommend:
content-based filtering:基于用户过去的行为习惯进行相似推荐,缺点是容易导致用户陷入filter bubble中,即所有的推荐都过于相似,缺少增量信息,因此实践中可能导致用户不再使用该推荐。
collaborative filtering:这种算法是基于相似用户来进行推荐的,因此缺陷是有可能无视推荐内容本身与用户的匹配性。
实践中一般会综合采用前两种算法。
factorization machines(FM):一种非常新的算法,主要针对的就是推荐算法中相关数据矩阵过于稀疏的问题(sparse dataset)。
denoising autoencoders(DAE):
自监督学习self-supervised learning:常见的应用是word embedding词嵌入,主流的算法是word2vec,其中常用的版本是skip-gram。
高斯过程Gaussian processes是与kernel regression竞争的一个模型,前者可以在预测时提供一个置信区间。
对于采样时假设服从高斯分布的模型已经有成熟的分析,因此当采样时样本的分布无法预测时,可能需要采用马尔科夫链蒙特卡洛法Markov Chain Monte Carlo。
对抗算法GAN是在零和博弈下的无监督学习。
遗传算法:当损失函数不可微时,常用的算法是genetic algorithms,比梯度下降速度要慢一些。
强化学习reinforcement learning:前面提到过,是一系列流程性算法,目标是优化长期收益,常用的算法如Q-learning适用的场景主要是游戏机器人、机器人寻路、库存供应链管理、智能电网以及金融交易领域等。
网站评分
书籍多样性:3分
书籍信息完全性:3分
网站更新速度:7分
使用便利性:8分
书籍清晰度:6分
书籍格式兼容性:9分
是否包含广告:5分
加载速度:3分
安全性:8分
稳定性:4分
搜索功能:3分
下载便捷性:6分
下载点评
- 赚了(373+)
- 品质不错(264+)
- 少量广告(291+)
- 一星好评(203+)
- azw3(272+)
- 速度快(169+)
- 好评(278+)
- 无广告(272+)
- 强烈推荐(449+)
下载评价
- 网友 家***丝: ( 2024-12-25 19:39:34 )
好6666666
- 网友 敖***菡: ( 2024-12-20 06:57:52 )
是个好网站,很便捷
- 网友 冯***卉: ( 2025-01-07 03:59:19 )
听说内置一千多万的书籍,不知道真假的
- 网友 菱***兰: ( 2025-01-04 06:06:28 )
特好。有好多书
- 网友 薛***玉: ( 2024-12-20 23:13:14 )
就是我想要的!!!
- 网友 訾***雰: ( 2024-12-20 02:20:43 )
下载速度很快,我选择的是epub格式
- 网友 沈***松: ( 2024-12-10 06:53:58 )
挺好的,不错
- 网友 居***南: ( 2024-12-25 04:44:32 )
请问,能在线转换格式吗?
- 网友 索***宸: ( 2025-01-05 11:13:22 )
书的质量很好。资源多
- 网友 隗***杉: ( 2024-12-13 01:18:40 )
挺好的,还好看!支持!快下载吧!
- 网友 丁***菱: ( 2025-01-05 12:05:43 )
好好好好好好好好好好好好好好好好好好好好好好好好好
- 网友 步***青: ( 2025-01-02 10:25:38 )
。。。。。好
- 网友 宓***莉: ( 2024-12-19 07:23:36 )
不仅速度快,而且内容无盗版痕迹。
喜欢"【年末清仓】《物业经营管理》命题点全面解读"的人也看了
中国奇谭典藏版漫画全套8册礼盒装【首刷限定赠品+周边礼包】 上海美术电影制片厂 bilibili官方授权正版中信 图书 在线下载 pdf mobi 2025 epub 电子版
旅游礼仪 在线下载 pdf mobi 2025 epub 电子版
The American Journey of Barack Obama奥巴马的美国历程 在线下载 pdf mobi 2025 epub 电子版
2014年中级经济师教材全国经济专业技术资格考试用书:运输经济(民航)专业知识与实务 在线下载 pdf mobi 2025 epub 电子版
汽车悬架转向与制动系统维修/国家中等职业教育改革发展示范学校建设系列教材 在线下载 pdf mobi 2025 epub 电子版
- 中国古典文学名著 足本典藏 水浒传 上下全2册 在线下载 pdf mobi 2025 epub 电子版
- 【预订】Ten Little Fingers and Ten Little Toes 9780547366203 在线下载 pdf mobi 2025 epub 电子版
- 积极心态带来成功 在线下载 pdf mobi 2025 epub 电子版
- 华图版2013深圳市公务员考试专用教材:综合知识与行政职业能力测验标准预测试卷(附赠360元网络课程+39元网课代金券) 在线下载 pdf mobi 2025 epub 电子版
- 数学分册·公共管理硕士(MPA)专业学位联考标准化题库 在线下载 pdf mobi 2025 epub 电子版
- 买卖二手房 在线下载 pdf mobi 2025 epub 电子版
- 中国古典文化精华:曾国藩挺经 在线下载 pdf mobi 2025 epub 电子版
- 商法练习题集(第四版)(21世纪法学系列教材配套辅导用书) 在线下载 pdf mobi 2025 epub 电子版
- 9787208115606 在线下载 pdf mobi 2025 epub 电子版
- 24春 学霸 课堂笔记 语文+学霸的寒假 计算+思维大通关 数学 四年级4年级下册 人教版部编版统编版(全2册) 在线下载 pdf mobi 2025 epub 电子版
书籍真实打分
故事情节:8分
人物塑造:8分
主题深度:8分
文字风格:6分
语言运用:6分
文笔流畅:9分
思想传递:4分
知识深度:7分
知识广度:3分
实用性:4分
章节划分:6分
结构布局:5分
新颖与独特:6分
情感共鸣:6分
引人入胜:3分
现实相关:3分
沉浸感:3分
事实准确性:6分
文化贡献:4分