一、数据仓库技术特点及相关问题讨论(论文文献综述)
赖世贤[1](2020)在《中国近代工业建筑营建过程关键性技术问题研究(1840-1949)》文中研究说明工业建筑作为中国近代新兴建筑类型及西方先进技术引进中国的最初载体之一,承载着当时中国较为先进的建筑理念,充当中国近代建筑追赶世界建筑潮流的不自觉历史工具。本文研究中国近代工业建筑营建过程中关键性技术问题,含括规划选址、大跨技术、标准化、结构发展等内容,分类探讨木材、砖、水泥等材料技术,同时关注工业建筑设计师。研究以调研过程中大量实物例证结合图纸资料、近现代建筑期刊文献及厂史资料进行,比对同时期西方先进技术,重视技术来源与技术真实性问题。研究对中国近代城市工业发展分期进行讨论,并提出相应分期方案。第二章以工厂的选址与布局入手,关注中国近代城市工业萌芽阶段工业建筑营建前期技术性问题,选址和布局贯穿工业建筑建设全过程,涉及宏观地区选择、中观地点选择、微观厂址选择及具体厂区布置等层面。第三章关注中国近代城市工业发展起步阶段,由于生产方式和动力技术改变引起对于大空间厂房即大跨度技术的迫切需求,重点关注西式木屋架。西式木屋架技术在材料和施工技术基本不变的情况下,展现出对于力学等结构概念的理解,意味着中国建筑近代转型开始。第四章则关注中国近代城市工业加速增长阶段,工业建筑由于大量快速建设带来对于高质量、标准化建材需求等问题。以砖的工业化生产及工业建筑用砖变化,探讨工业化时代下中国传统建筑材料在引进西方建筑材料后的各方面技术发展。第五章则聚焦中国近代工业稳速增长阶段如何解决工业建筑营建所要求的安全舒适、结构持久等问题,关注钢筋混凝土结构技术及与之紧密相关的水泥生产技术引入与发展。第六章将专业人才视为技术实施保障予以讨论,关注中国近代工业发展放缓期对工业建筑营建规范化、经验化起关键作用的设计师及代表作品、设计师群体组成等问题。研究发现在中国近代城市工业发展各时期不同阶段,基于建设目标需求及技术水平不同,中国近代工业建筑营建过程中关键性技术问题亦不相同。对中国近代工业建筑而言,部分营建关键技术与当时世界先进技术相比并不逊色,但技术推广和实现受社会环境及观念意识影响甚大;技术要与当地资源、经济及社会体制相适应,社会需求会强有力改变技术的运用及传播;由于材料观念缺失,其在营建过程中重外观轻建造,重模仿轻创造;技术属于文明范畴,由初级走向高级是趋势,中西方建筑技术融合也是趋势。
王冬冬[2](2020)在《教师研修社区学习者模型构建及应用研究 ——以“A”教师培训平台为个案》文中认为伴随我国教育事业发展得如火如荼,帮助教师队伍建立过硬的职业素养与全面的行业素质,将是未来教育事业发展的重要趋向。建立健全即符合教师实际需求又具备先进理论支撑的教师培训体系是教师队伍综合素质提升的关键。教育兴国,科技助教,互联网技术以广泛的适用范围与卓越的实际效果,已然渗透至行业的方方面面。网络研修社区作为近期一经兴起便立刻成为讨论焦点的教师研修新思路,如今已在试点城市推行过程中成效显着,具有可观的实际成效。“A”教师培训平台是当前教师网络研修社区平台中,具有一定影响力的主流平台的代表。与诸多教师网络研修社区类似,其立足于远程培训与网络研修两大支柱功能,同时为教师进行集体研学交流,分组教研探讨,交流教学心得,交互经典案例提供平台支撑。再者,伴随多年运营以及使用经验,平台对于各成员自身个人信息以及相关学习行为加以统计,纳入大数据库。借助海量多维数据对其进行综合性归纳整合,进一步勾画出更具针对性与实践性的学习者画像,能够将学习者信息以及特点进行直观表现,对于教师培训平台优化培训效率,优化培训体系具有重大意义,能够为最大化地满足求学者以及教学者所需,为全面提高培训质量夯实根基。因此,本研究以网络研修社区支持科学决策和高效管理为大方向,选择“A”平台为实验平台,通过对“A”平台的改造,将以近期大家关心的重要命题——网络研修社区的学习者画像为目标,以网络研修社区学习者模型建构为研究主题。首先,对于平台数据进行归纳整理,并对其进行预处理,立足于业务实际需求,建立更具全面性的数据汇聚表,从而,进一步设计数据资产评估报告;其次,选用主成分分析法,围绕学员实际情况设计综合评价体系,随后,邀请专家对于该体系精确度与待优化部分进行微调;再次,笔者尝试选择k-means算法,以平台学员为对象进行聚类分析,对于各学员维度具体情况进行针对性剖析,依据学员平台学习实践过程中暴露出的缺陷,提出切实可行的优化举措;最后,采用协同过滤算法,进一步做好平台对口教学资源以及教培课程的自动推荐,为用户推荐关联度较高的学习伙伴,并及时推荐研修活动信息,依据其最终数据验证推荐成效。研究成果主要在于:其一,进一步为教师网络研修社区平台大数据埋点与收集提供理论指导,构设较为先进科学的数据汇聚表,建立更具针对性与全面性的数据仓库;其二,打造立体化、多元化能够完美契合学习行为逻辑与步骤的评价模型;其三,帮助平台教师以及管理负责人更直观地了解学习者自身实际情况,进一步为学员自动推荐对口学习服务以及学习伙伴,真正确保课程快速推进,捕捉大众需求热点,给予学员更具针对性与实践性的课程学习体系;其四,借助本研究成果,能够为同类型数据挖掘实证调研以及相近领域优化模式贡献一些思路。
张宜建[3](2020)在《基于敏捷思想的数据仓库云化项目风险管理研究》文中认为自20世纪90年代提出数据仓库的概念至今,数据仓库一直在企业智能决策领域扮演着重要角色。云计算和大数据处理技术的出现,为传统数据仓库突破架构瓶颈、寻求架构升级指明了新的方向,因此越来越多的企业开始构建其下的云平台数据仓库,而为了使传统架构下的数据仓库系统实现云平台化,则需要历经复杂的云化过程。数据仓库的云化不是简单的“拿起来再放下”的过程,为了适应云平台环境,除了需要迁移大量数据,还需要对底层业务数据处理流程和ETL流程进行加工改造。数据处理流程的加工改造亦属于典型的软件开发项目,因此数据仓库的云化也存在软件项目所固有的高风险特性。由此可见,需要为数据仓库云化项目制定一个合适的风险管理方案,才能为此类项目保驾护航。本文通过分析传统软件项目风险管理和敏捷风险管理理论特点,在参阅国内外文献的基础上提出了基于敏捷思想的轻量级、结构化、流程化的风险管理方案,并给出了该方案的具体实施方法,最后将该方案应用于实际的数据仓库云化项目。该方案运用调查问卷法收集整理项目风险因素,然后归纳总结风险分类、制定相应的应对方案和风险登记表。通过制定的应对方案和风险登记表,指导项目团队综合应用轻量级的技术方法和工具,在后续迭代开发中执行风险识别、风险评估、风险应对、风险监控等各类风险管理活动,保证了数据仓库云化项目的顺利实施。通过对该轻量级、结构化、流程化的风险管理方案应用于数据仓库云化项目,项目团队有效地控制了项目风险水平,从而验证了该方案的实用性和适用性,并拓宽了敏捷风险管理理论的应用范围。
郑丹辉[4](2020)在《大数据仓库数据模型在电子政务中的应用研究》文中研究表明大数据时代,数据引擎已成为组织服务创新、经济社会发展和国家治理能力现代化的核心驱动力,构建大数据驱动的政务新平台,成为电子政务发展的重要内容。基于关系型数据库系统的传统数据仓库在存储、加工及分析规模庞大、种类繁多的数据方面存在局限性,电子政务领域数据归集遇到数据质量问题,导致数据可信度差,影响数据共享和大数据辅助决策分析,亟需通过大数据仓库数据建模实现对数据有效管理和治理。数据集成于大数据仓库,针对大数据体量庞大的特点,在多数场景下不可能每次都采集全部数据,海量数据增量采集被广泛关注。本文从大数据仓库的数据模型分层、数据治理模型和数据增量采集三个方面,研究探讨了大数据仓库数据模型及在电子政务中的应用。第一,依据Kimball提出的数据仓库维度建模理论,基于Hadoop的Hive数据仓库,给出大数据仓库数据模型的分层架构。架构整体分为数据缓冲层(STG)、操作数据层(ODS)、公共数据层(PDW)和数据应用层(ADM)。结合数据分层和命名规则,设计实现大数据仓库分层的数据模型,在电子政务中应用大数据仓库分层架构,发挥大数据辅助科学决策和精准施策。第二,针对政府部门归集数据遇到的数据质量低劣问题,参照数据治理框架中的数据治理过程和数据模型分层架构,研究探讨了数据质量治理模型。模型从数据质量规则和数据质量反馈闭环两方面,引导源头数据从内容格式、数据模型和数据标准上优化改进,满足数据质量提升的需求。数据质量规则分为:数据清洗转换规则和数据质量稽核规则。数据质量反馈闭环,采用PDCA质量管理方法,将质量问题进行溯源。第三,研究数据集成全量和增量同步技术,提出非侵入式变化数据捕获方法NICDC。综合时间戳和全表比对的思想,设计时间和空间两种维度计算方法,从数据行和数据列对增量数据捕获能力进行提升。在实践中,使用NICDC方法无需对业务系统进行升级改造,能够快速捕获增量数据,提高大数据仓库集成数据的效率和增量数据的准确性。
李伟超[5](2020)在《停车管理数据仓库构建与可视化分析》文中提出停车困难的问题日益严峻,不仅反映了停车站点现存资源的规划缺乏一定的科学性,也体现了企业对于大量停车数据信息分析利用的不完整。充分应用相关数据进行分析并制定正确的决策需要完整、科学的企业解决方案系统,现有的企业级数据管理系统更偏向于数据的查询以及存储功能,面向业务数据分析的应用仍具有一定的不足,而商务智能系统在具备数据存储、数据查询功能的技术基础上提供了面向用户的多维数据分析操作,通过运用商务智能系统可以系统地构建一整套针对相关数据存储、数据质量处理、数据建模分析以及分析结果展示的智能数据平台,在基于数据仓库针对企业数据分析功能的基础上应用可视化技术对数据分析结果进一步展示,实现了对企业相关业务决策制定的支持。本文主要以SQL Server Business Intelligence工具构建停车管理企业的商务智能系统,其中核心技术包括ETL流程设计、数据仓库构建以及可视化技术研究应用。其中,通过ETL技术实现了停车管理部门相关业务数据的质量完善以及各类源数据整合;在构建数据仓库过程中,针对已完善的数据制定相关的分析业务主题并构建多个数据维度,实现停车管理数据的多维度分析;最终应用数据可视化技术灵活、直观地对停车管理数据分析结果进行展示,为用户制定相关决策提供数据支持。本文在ETL流程设计中,针对数据抽取的方式采取了全表插入的方法;对数据进行修改实现数据的清洗设计,并以统一数据类型的方法进行数据转换。在构建数据仓库过程中,针对停车管理企业的业务规则制定了4个业务主题,并对各个主题及其属性组进行逻辑关系划分,最终构建相应的事实表以及维度表完成数据仓库的构建。在以数据报表形式对数据分析展示的基础上进行技术拓展,应用开源代码以及map V、Fine Report工具软件实现基于数据仓库的可视化分析综合应用。通过应用本文研究的技术方法,帮助企业分析了实际的运营情况,对相关决策的制定起到了积极的作用,基本满足企业解决实际问题的需求。
梁旺[6](2020)在《基于Hadoop的移动互联网用户与制造业从业情况的大数据分析系统的设计》文中研究指明近两年,随着移动流量资费的下调与移动终端设备的普及,移动互联网技术在横向和纵向上得到了广泛的发展。移动互联网的用户呈指数性的激增的同时,移动互联网技术和产品也得到了纵深的发展。分析移动互联网上的用户有助于我们了解用户的行为、监测用户的变化。而传统的单机型的数据采集与分析技术已经无法满足暴涨的用户数据,面对这一新增的数据资源,使用基于云系统的Hadoop大数据分析技术是目前较为流行的的技术解决方案。在这样的背景下,本文以移动互联网上产生的大量视频用户数据为数据来源。面对如此大批量的数据资源,需要合理的存储技术与数据预处理技术,才能支持后续的数据查询与分析。数据的ETL是数据仓库构建的一个重要环节,是所有数据分析的基础,它主要进行数据的抽取、转换与清洗、数据加载,而要实现大批量数据的联机查询分析,本文采用维度建模方法对数据仓库进行设计。本文进行的主要工作如下:(1)详细分析说明了当前移动互联网用户产生的视频数据的现状,从大数据分析的角度对整个系统进行了需求分析与功能分析,完成了需求分析与技术选型的工作。(2)比较了传统的数据ETL技术与现今较为流行的几种数据ETL模式和技术框架,使用Python语言对Map Reduce框架进行了封装与开发,作为数据分布式ETL的主要编程与数据预处理框架;Hadoop是一种离线的大数据处理框架,选择Hadoop中的Map Reduce与HDFS为本系统的数据计算框架与存储,研究了HDFS的数据存储与Map Reduce编程框架原理。(3)设计并实现了数据的计算技术构架,包含数据层、计算层、接口层、执行层、应用层。以实际的数据流进行数据仓库的设计,采用维度建模方法对数据仓库进行设计,分析数据主题,最后从物理上对数据事实表和维度表进行设计。(4)完成了整个系统的设计与实现,最终系统能够上线运行进行数据计算分析,系统能够从大量的低价值密度的数据中完成对当前移动互联网用户的现状与制造业从业情况的相关计算分析。
张颢译[7](2020)在《混合式教学环境下学习分析系统的设计及实现》文中指出近些年,国家不断推行教育信息化建设,在线学习平台迅猛发展,线上教学与线下教学相结合的混合式教学环境正在形成。本次课题的目标便是设计及实现一个能够较好地支持混合式教学环境的学习分析系统,帮助教师及时了解学生情况、发现学习指标间关系、研究教育理论,具有重要意义。主要研究内容如下:首先本文通过数据仓库理念,在一定程度上解决了混合式教学环境下多数据源混杂的问题,使得不同平台的多维数据可以有机融合、相互补充,避免了单一平台产生的数据冗余,增加了数据独立性,能够从多个角度提供更加完备的数据信息。其次本文对不同平台数据进行了针对性地建模与量化,其中提出MtAEC模型分析了多主题混杂的聊天数据,发掘了学生的聊天习惯与聊天主题,将学生基础数据转变为学习积极性、学习进度等信息,更好地表征了学生情况。再次本文提出通过相关性分析来检测数据量化模型的方法,根据相关性结果不断优化数据量化的模型,以客观结果为导向能够使量化模型更加准确,使得量化结果能够更好的反映学生情况。最后本文采用静态分析与动态分析相结合的方法,在保证系统性能的前提下极大地满足了用户需求,并通过本校大一信通导论课学生的实际数据案例,检验了系统的可行性。
贾翼[8](2020)在《基于Hive的电商多维分析系统的设计与实现》文中提出最近几年,我国大数据在政策、技术、产业、应用等多个层面都取得了显着进展,中国数字经济规模大幅增长。与此同时,电商互联网公司也掌握了其他行业和企业无法相比的大数据,拥有着最精准,最全面的用户数据,因此,运用巨量数据指导企业的运营和加速互联网产品的升级,也形成为了未来电商互联网公司向数据驱动服务和争夺市场份额的共识,而数据源的异构性以及PB乃至TB数量级历史数据的应用转化却对采用传统的企业数据仓库的多维分析带来了巨大的挑战。为了解决海量数据下传统基于大型服务器的数据仓库高额运维代价,以及凭借人员经验迭代互联网产品局限性,本文充分考虑电商用户数据的特点,设计并开发了基于Hive的电商多维分析系统,进而用数据驱动决策和智慧运营,提高数据资源的复用性,该系统实现了基于CDH的大数据平台架构,并在此平台之上实现基于Hive的四层数据仓库,通过分层建设数据仓库,大大提升了数据治理能力,保证了数据质量,优化了传统通过Linux下crontab的作业调度,集成Azkaban作业调度,全面监控数据运行,并实现了电商用户活跃等相关指标,论文的主要工作如下:1.本文研究了现有的大数据平台相关技术,搭建了基于CDH的企业级大数据平台并设计实现了基于CDH平台的Hive数据仓库。2.提出并设计了一种新型的自研组件即基于Kafka的多管道(Pipline)采集模块,解决了异构数据源的加载与存储问题,在异构系统大规模的数据迁移中保证了大数据的数据一致性,很好的控制了数据的质量水平。3.基于Hive提出并设计了四层数仓数据模型,实现了数仓不同层级之间不同粒度数据管理,加速了查询过程与数据计算过程,并运用SSM框架实现了数据可视化。4.集成Azkaban作业调度系统,解决传统数仓人工报表的编写难、维护难、升级难的问题,设计实现数据仓库作业全自动调度并完成系统测试。
宋敏[9](2019)在《大数据在基层税收征管上的应用研究》文中提出自21世纪以来,大数据已上升为国家发展战略,与各行各业的联系也越发紧密。与此同时,税务机关所掌握的涉税数据也呈现出指数级的增长:金税三期于2012年在重庆进行了首次双轨试运行工作;2016年开始覆盖全国;2017年税务部门与更多部门实现了信息共享。强大的数据管控能力才能支撑起税收治理现代化,如何将数量庞大且形式不同的涉税数据进行科学的采集、整合和分析,为税务机关提供客观且全面的决策依据,成为推广税收征管信息化的一项重要任务。本文是以大数据的视角出发,采用文献分析法、理论与实践相结合法、实证研究法,对基层税收征管的基本要求、条件限制和应用现状进行了说明,并分析了大数据背景下税收征管中存在的问题,具体包括信息的采集与整合、税源监控、税收风险管理和信息化人才队伍这四方面。针对这些征管问题出发,采用数据仓库技术、SQL语言和K-MEANS聚类分析对大数据技术在信息采集与整合、税源分类和税源监控中所扮演的重要角色进行案例模拟,以此凸显出大数据在税收征管中的重要作用,其中所采用的数据来源于泸州市税务局系统和财经类网站。最后,结合国外税收征管中的相关经验以及应用模拟中大数据技术的优劣势分析,提出推进大数据应用于基层税收征管的四点建议:加强数据信息管理,搭建数据仓库平台;加大税源监控力度,完善数据挖掘流程;实现科学纳税评估,提高风险管理水平;建设信息化人才,为大数据运用助力。期望对我国基层税务机关在大数据背景下的税收征管产生积极的影响。
韩晓峰[10](2018)在《基于数据挖掘的互联网金融风控评价研究》文中研究指明互联网金融(简称互金)的定义是将互联网技术与金融功能有机结合的一种新兴技术,一般情况下从功能上互金可以分成第三方支付、网络借贷、大数据金融、众筹、信息化金融机构、互联网金融门户六大类,而其中的网络借贷又包含了网络P2P借贷和网络小额贷款等。在网络P2P借贷中的风控按照阶段又分为审批前风控、审批环节风控、授信环节风控、贷后存量客户管理环节风控、贷后逾期客户管理环节风控、资金流动性管理环节风控、放款环节风控七类,其中最重要的风控就是前三个风控环节,这三个风控统称贷前风控,而网络P2P借贷中的贷前风控(简称借贷互金贷前风控)就是本次论文所讨论的重点和方向。对于借贷互金企业来说,风控的本质是对用户数据进行建模并对风险进行定价,一般的风险定价模式是采取对用户的信用程度打分的方式,在银行中,一般采用人民银行的征信报告来统一对客户的信用程度进行评判,其评判结果也被众多银行作为贷前风控的重要考量因素之一。对于借贷互金类企业来说,人行征信评判结果固然很好,但人行征信报告只对外提供了简单版本的评判报告,只有银行机构才有权限查看完整版的征信报告。这种简版的征信报告对于借贷互金类企业是不够的。这种市场空缺也促成了一批第三方征信机构的崛起,尽管人行征信数据并不对第三方征信机构和借贷互金企业开放,但基于互联网的优势,第三方征信机构和借贷互金企业依然可以根据所搜集到的海量用户数据、消费行为数据和社交行为数据完成了对用户的借贷风险定价,其价值在金融场景中与人行征信的效果是相似的,甚至在一部分特定场景下要比人行征信的风控效果还要优秀。其中比较有代表性的就是前海征信和蚂蚁金服,这两家互联网金融科技企业也是互联网金融领域内规模较大的企业,其中的蚂蚁金服比较多侧重于用户的电商场景,其数据来源多来自于淘宝,天猫和支付宝交易等电商业务场景。而前海征信的数据更多的来自平安集团旗下的银行,保险等场景,这种差异是与其产品生态特性是相关的。随着敢于超前消费的90后消费群体的成长,随之而来的是借贷互金的蓬勃发展,借贷互金企业推出了全新的风控模式迅速填补了市场空白,通过应用数据挖掘技术对海量用户数据的分析和建模,构造出了全新的风控评价机制,并在技术和算法的驱动下对海量数据进行分析,实现对用户的精准画像,完成了传统银行无法实现或者无法低成本实现的风控定价,从而实现了对金融风险定价的重塑,一方面降低了风控成本,提升了客户满意度,另一方面也将风控评价的效率和峰值容量等技术指标较传统模式有了大幅度的提升。新的风控模式一方面通过电脑自动审核并且无需人工干预,另一方面对用户的风险进行评判,通过观测某些数据指标来断定借款风险,极大的降低了审核成本,增加了企业利润。论文首先阐述了借贷互金贷前风控评价的背景、意义及目标和相关研究方法。并介绍了在本次论文中所涉及到的风控评价的相关理论依据和采用的技术和知识。重点介绍了行为金融学,数据挖掘的相关知识和本次论文实验用到的决策树算法和Weka软件。其次,本论文阐述了风控评价模型在借贷互金企业中所涉及到的诸多指标的分类和构建原则,分析期间应用了行为金融学的风险度量和心理决策知识将全部数据指标分成了认证,生物识别,借款还款和行为数据4大类别。并在此基础之上节选取了 47个风控指标数据作为本论文所讨论的风控评价模型的研究指标。再次,本论文讨论了如何通过对数据指标按照数据仓库星型结构规范设计风控评价数据仓库,详细阐述了数据仓库的建模实践原则和具体的字段含义。并以活动图的形式展示了数据仓库的清洗-转换-加载(ETL)的详细步骤。接着,本论文使用weka工具通过C4.5决策树算法对数据仓库的数据进行了分析和结果校对,并得出了准确率在96.49%的实验结论。最后,本论文对风控评价实验过程中的存在的问题和不完善之处进行了分析和总结,并对未来的研究方向进行了展望。本论文的创新点在于基于行为金融学理论对于借款人的行为数据进行分析和建模,希望能够发现行为数据与风控评价模型的关系。
二、数据仓库技术特点及相关问题讨论(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、数据仓库技术特点及相关问题讨论(论文提纲范文)
(1)中国近代工业建筑营建过程关键性技术问题研究(1840-1949)(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 选题背景与研究意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 研究对象与概念界定 |
1.2.1 研究对象界定 |
1.2.2 时间概念界定 |
1.2.3 空间范围说明 |
1.3 文献综述及前期分析 |
1.3.1 中国近代建筑的相关研究 |
1.3.2 中国近代工业建筑的相关研究 |
1.3.3 中国近代建筑技术的相关研究 |
1.3.4 中国近代工业建筑营建技术相关研究小结 |
1.4 研究内容与研究目标 |
1.4.1 研究内容 |
1.4.2 研究目标 |
1.5 研究方法与研究难点 |
1.5.1 研究方法 |
1.5.2 研究难点 |
1.6 论文研究整体框架 |
第2章 近代工业萌芽起步期工厂选址规划与厂区布局的探索 |
2.1 技术载体:萌芽起步期军事工厂的典型性 |
2.2 宏观布局:地区选择——初期规划缺位与后期调整乏力 |
2.3 中观布局:地点选择——初期运输依赖与后期全面平衡 |
2.4 微观布局:厂址选择——初期因地制宜与后期逐步合理 |
2.4.1 江南制造局——两次选址失误 |
2.4.2 金陵制造局——邻护城河建厂 |
2.4.3 福州船政局——风水择地典型 |
2.4.4 天津机器局 |
2.4.5 广东机器局——近海到近铁路 |
2.4.6 北洋水师大沽船坞——结合祭祀文化 |
2.4.7 吉林机器局——资源优于运输 |
2.4.8 湖北枪炮厂(汉阳铁厂)——多个方案比较 |
2.5 厂区布局:总平面设计——“幼稚时代”的想象与探索 |
2.5.1 江南制造局——功能重叠引起流线混乱 |
2.5.2 金陵制造局——自由布局适应生产流程 |
2.5.3 福州船政局——分区明确兼顾礼制秩序 |
2.5.4 天津机器局 |
2.5.5 广东机器局——传统合院影响厂区布局 |
2.5.6 北洋水师大沽船坞——缺乏规划下一事一建设 |
2.5.7 吉林机器局——完全独立自主设计 |
2.5.8 汉阳铁厂(汉阳兵工厂)——比邻建设带来资源共享 |
2.6 近代工业萌芽起步期军事工厂选址布局及建设特点 |
2.6.1 结合传统风俗观念择地因地制宜利用旧有建筑 |
2.6.2 有目的规划设计偏少与有控制的建设过程缺乏 |
2.6.3 自由生产流线与传统等级秩序制约的平面布局 |
2.6.4 功能复合下空间布局及建筑形式的本土化改良 |
2.7 国内外工业发展早期工厂规划设计及理论的发展 |
2.7.1 国外早期工厂建筑规划选址及设计 |
2.7.2 国内近代工厂选址设计理论的发展 |
2.8 本章小结 |
第3章 近代工业萌芽起步期西式木屋架技术发展与中西互鉴 |
3.1 中西木屋架技术之别及西式木屋架体系传入 |
3.1.1 中西技术差异——基于力学原理的形式差异 |
3.1.2 知识引介普及——《建筑新法》及书中所载木屋架类型 |
3.1.3 名称反应认知——西式木屋架及各构件名称演变 |
3.1.4 需求引发变革——工厂建筑西式木屋架应用概况 |
3.2 近代工业萌芽起步期工业建筑木屋架技术应用 |
3.2.1 洋务运动中的机器局兵工厂 |
3.2.2 民族工业发展下的工业建筑 |
3.3 构造技术发展与木材使用 |
3.3.1 整体性补强与抗震技术构件增加 |
3.3.2 木构架之间结合方式与位置选择 |
3.3.3 木屋架与墙体及柱子间结合方式 |
3.3.4 进口木料与国产木材的使用偏好 |
3.4 本章小结 |
第4章 近代工业快速发展期制砖工业化与工业建筑用砖技术 |
4.1 建材生产方式的改变——近代制砖工业技术发展 |
4.1.1 传统制砖技术延续 |
4.1.2 制砖技术的机械化 |
4.1.3 制砖工厂规划建设 |
4.2 建材生产变革的深入——产品类型变化与质量标准推行 |
4.2.1 产品及原料的多样化 |
4.2.2 规格与质量的标准化 |
4.3 建材生产变革的影响——制砖技术传播与砖瓦产业勃兴 |
4.3.1 制砖技术传播 |
4.3.2 制砖工业分布 |
4.4 工业建筑用砖技术的改变 |
4.4.1 “青”“红”之变——观念改变与技术改变之辩 |
4.4.2 砌筑方式——规格统一带来的改变 |
4.4.3 粘合材料——对应砌体改变的变化 |
4.4.4 特殊构造——回应工业生产的处理 |
4.5 本章小结 |
第5章 近代工业快速发展期水泥引进与工业建筑混凝土应用 |
5.1 从落后到超越——中国近代水泥工业发展 |
5.1.1 大量建设保障——中国近代水泥产量提升 |
5.1.2 窑体技术变革——国际水泥生产技术提升 |
5.1.3 后发外生优势——中国近代水泥技术提升 |
5.1.4 多样企业类型——中国近代着名水泥企业 |
5.1.5 曲折前进及多样技术来源 |
5.2 营建技术提升——近代混凝土工业建筑技术应用 |
5.2.1 西方近代钢筋混凝土技术发展及其在工业建筑的应用 |
5.2.2 “过渡型”的结构——钢骨混凝土结构的引入与应用 |
5.2.3 中国近代钢筋混凝土结构工业建筑的技术应用 |
5.2.4 近代工业快速发展期钢筋混凝土工业建筑营建技术特征 |
5.3 本章小结 |
第6章 近代工业发展放缓期工业建筑设计专业化 |
6.1 西方近代工业建筑设计发展与专业化 |
6.2 从“工匠”到“建筑师”——身份认同与地位转变 |
6.2.1 主业之外兼营副业——洋行发展与设计类洋行(机构)产生 |
6.2.2 华洋混合来源复杂——中国近代建筑设计师产生 |
6.2.3 工业建筑审批制度——《建筑工厂审核法》颁布 |
6.3 中国近代工业建筑设计机构与设计师 |
6.3.1 经验建设与跨界参与——非建筑专业人员的设计 |
6.3.2 以施工带入建筑设计——营造厂(施工方)的设计 |
6.3.3 执业特点与专业设计——专业建筑设计师设计 |
6.4 中国近代工业建筑设计发展与专业化过程特征 |
6.4.1 中国近代工业建筑设计特点 |
6.4.2 近代工业发展放缓期建筑设计专业化加速 |
6.5 本章小结 |
第7章 结论 |
7.1 研究主要成果及结论 |
7.1.1 中国近代城市工业发展分期方案 |
7.1.2 中国近代工业发展中工业建筑营建过程关键性技术问题探讨 |
7.1.3 技术的适应性及技术选择 |
7.1.4 营建技术观念及文化抗争 |
7.1.5 技术真实性及其重要意义 |
7.2 研究创新 |
7.2.1 系统梳理中国近代工业建筑建造技术史 |
7.2.2 分类研究建筑材料及其生产流程和技术应用 |
7.2.3 尝试对技术实现保障的制度和建筑师的研究 |
7.3 未竟之处 |
7.3.1 和海外的技术关联性需要进一步深入探索 |
7.3.2 和遗产物证的相关性需要进一步延伸拓展 |
7.3.3 研究营建技术发展尚未深入结构力学分析 |
参考文献 |
附录A:随文附表 |
附录B:随文附图 |
发表论文和参加科研情况说明 |
致谢 |
(2)教师研修社区学习者模型构建及应用研究 ——以“A”教师培训平台为个案(论文提纲范文)
摘要 |
Abstract |
引言 |
一、研究背景 |
(一) 教师网络研修成为教师培训的新型方式 |
(二) 以促进学员个性化发展为核心诉求的在线教育进入新阶段 |
(三) 新技术的迅猛发展为我国教师教育信息化开创了新天地 |
二、问题提出 |
(一) 传统教师网络研修社区难以实现针对学习者的个性化教学与管理 |
(二) 研发个性化智能教学系统是解决教师网络研修社区学习缺乏个性化的关键 |
(三) 学习者模型建立是个性化智能教学系统研究的核心基础环节 |
(四) 基于“A”平台的学习者行为建模实证研究 |
三、概念界定 |
(一) 教师专业发展 |
(二) 教师网络研修 |
(三) 教师网络研修社区 |
(四) 教师工作坊 |
(五) 学习者模型 |
四、研究意义 |
(一) 理论意义 |
(二) 实践意义 |
五、研究创新点 |
(一) 首次在中小学教师网络研修社区中引入学习者模型 |
(二) 利用聚类分析构建网络研修社区的学习者模型 |
六、研究目标与内容 |
(一) 研究目标 |
(二) 研究内容 |
七、研究框架 |
(一) 理论研究 |
(二) 实践研究 |
八、研究方法 |
(一) 问卷法 |
(二) 个案研究法 |
(三) 科学模型法 |
(四) 文献研究法 |
九、本章小结 |
第一章 教师网络研修社区存在问题的研究 |
一、研究说明 |
二、问题调研的理论基础 |
(一) 技术接受度理论与模型 |
(二) 技术接受评价框架 |
(三) 网络研修社区接受度评价框架 |
三、调研问卷的设计及调研结果 |
(一) 教师网络研修社区情况调查问卷设计与开发 |
(二) 教师网络研修社区调研结果 |
(三) 教师使用网络研修社区接受度分析 |
(四) 教师网络研修社区存在的问题分析 |
四、网络研修社区的改进发展分析 |
(一) 依托数据分析将现有的网络研修社区进行智能化改造 |
(二) 具备快速识别学习者需求与偏好的能力 |
(三) 支持对学员的个性化教学 |
五、构建学习者模型是实现网络研修社区智能化改造的基础 |
六、本章小结 |
第二章 教师网络研修社区学习者建模的相关研究现状梳理 |
一、教师专业发展研究 |
(一) 教师专业发展研究的起源 |
(二) 国内外对教师专业发展的研究 |
(三) 对教师专业发展研究的分析 |
二、教师网络研修社区的特点及其对学习者的评价 |
(一) 教师网络研修社区的特点 |
(二) 教师研修社区中的学习者评价 |
(三) 教师网络研修社区及其学习者评价的文献分析与评价 |
三、学习者建模 |
(一) 学习者模型的分类 |
(二) 学习者建模的方法 |
(三) 学习者建模研究文献分析与评价 |
四、本章小结 |
第三章 教师研修社区学习者模型构建的教育理论研究 |
一、教师专业发展理论 |
(一) 教师专业发展阶段理论 |
(二) 体验式学习理论 |
二、柯氏四级培训评估模型 |
(一) 使用背景 |
(二) 理论基础 |
三、成人学习自我导向理论 |
(一) 成人学习理论 |
(二) 成人学习自我导向学习理论 |
(三) 成人学习自我导向学习理论在本研究中的应用 |
四、学习分析技术理论 |
(一) 学习分析的概念 |
(二) 学习分析的应用范围 |
(三) 学习分析的构成与模型的理论基础 |
五、本章小结 |
第四章 教师研修社区学习者模型构建的技术理论研究 |
一、技术理论研究的思路与主要方法 |
(一) 研究思路 |
(二) 主要方法 |
二、关键技术研究 |
(一) 建立数据仓库 |
(二) 数据汇聚 |
(三) 数据资产评估 |
(四) 特征与指标计算 |
三、本章小结 |
第五章 教师网络研修社区学习者模型的实现与模型应用研究 |
一、数据说明 |
二、教师研修指标体系的构建 |
(一) 明确目标,构建维度 |
(二) 特征设计 |
(三) 指标体系构建 |
(四) 维度聚类 |
三、学习者分类 |
(一) 学习者分类概述 |
(二) 分类方法理解 |
(三) 分类类别确定及计算 |
四、“A”教师网络研修社区学习者模型结果分析 |
(一) 聚类结果分析 |
(二) 对应分析不同类别学习者的特征 |
(三) 对应分析不同类别学习者的行为特征 |
五、成果检验与应用 |
(一) 通过真实培训项目验证学习模型的有效性 |
(二) 基于学习者模型的个性化推荐功能的实现 |
(三) 借助学习者模型提出“A”教师培训平台改善的规划 |
(四) 应用学习者模型提升培训质量 |
六、本章小结 |
第六章 总结与讨论 |
一、研究创新 |
(一) 教育理论层面 |
(二) 建模方法层面 |
(三) 技术算法层面 |
二、研究不足 |
(一) 学习者模型的精准度不足 |
(二) 对学习者类别的识别结果进行实证测量的不足 |
(三) 基于多时间阶段、多项目的指标体系试用的不足 |
(四) 将学习者画像与教学实践相结合的不足 |
三、研究展望 |
(一) 结合社交网络分析 |
(二) 结合语义分析 |
(三) 探究自适应学习 |
四、本章小结 |
参考文献 |
附录 |
附录一 中国基础教育教师网络研修社区调查问卷 |
附录二 中国基础教育教师网络研修社区调查问卷 |
附录三 教师网络研修社区调研结果 |
后记 |
在学期间公开发表论文及着作情况 |
(3)基于敏捷思想的数据仓库云化项目风险管理研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.3 国内外研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.3.3 研究现状综述 |
1.4 主要研究方法 |
1.5 论文创新点 |
1.6 论文结构及内容 |
第二章 数据仓库云化项目相关理论概述 |
2.1 数据仓库相关理论 |
2.1.1 数据仓库概念及发展 |
2.1.2 云计算概念简述 |
2.1.3 数据仓库云化项目一般过程 |
2.2 软件项目管理理论 |
2.2.1 软件项目管理概述 |
2.2.2 软件项目风险管理概述 |
2.3 敏捷开发项目管理理论 |
2.3.1 敏捷项目管理概述 |
2.3.2 敏捷项目风险管理概述 |
2.4 小结 |
第三章 A公司数据仓库云化项目概况 |
3.1 A公司数据仓库云化项目介绍 |
3.1.1 A公司简介 |
3.1.2 项目背景 |
3.1.3 项目简介 |
3.1.4 项目规划 |
3.2 云化项目风险管理现状分析 |
3.2.1 项目面临的挑战 |
3.2.2 项目风险管理现状分析 |
3.3 小结 |
第四章 数据仓库云化项目风险管理实践 |
4.1 基于敏捷思想的风险管理方案 |
4.1.1 敏捷思想风险管理方案内容 |
4.1.2 敏捷思想风险管理方案实施方法 |
4.2 敏捷思想风险管理方案应用 |
4.2.1 云化项目风险规划 |
4.2.2 云化项目风险识别 |
4.2.3 云化项目风险评估 |
4.2.4 云化项目风险应对 |
4.3 持续可视化风险监控 |
4.3.1 风险监控目的 |
4.3.2 风险泳道图追踪应对进展 |
4.3.3 风险燃尽图分析 |
4.4 敏捷思想风险管理方案效果总结 |
4.4.1 项目风险水平得到有效控制 |
4.4.2 项目团队风险管理能力的提升 |
4.5 小结 |
第五章 结论与展望 |
5.1 研究结论 |
5.2 不足与展望 |
参考文献 |
致谢 |
(4)大数据仓库数据模型在电子政务中的应用研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 研究内容 |
1.4 组织结构 |
2 大数据仓库技术基础 |
2.1 数据仓库技术 |
2.1.1 数据模型设计 |
2.1.2 政务数据仓库 |
2.2 Hadoop架构体系 |
2.2.1 Hive |
2.2.2 大数据仓库 |
2.3 政务数据集成技术 |
2.3.1 政务数据同步规范 |
2.3.2 政务数据采集方式 |
2.4 本章小结 |
3 大数据仓库数据模型研究 |
3.1 数据模型分层架构 |
3.1.1 数据缓冲层(STG) |
3.1.2 操作数据层(ODS) |
3.1.3 公共数据层(PDW) |
3.1.4 数据应用层(ADM) |
3.2 政务数据质量治理模型 |
3.2.1 治理模型质量规则 |
3.2.2 治理模型闭环流程 |
3.3 政务海量数据增量采集 |
3.3.1 空间维度 |
3.3.2 时间维度 |
3.3.3 NICDC方法 |
3.4 本章小结 |
4 大数据仓库数据模型在电子政务中的应用实现 |
4.1 应用实现基础 |
4.1.1 应用实现框架 |
4.1.2 集群部署结构 |
4.2 大数据仓库分层数据建模实现 |
4.2.1 建模约定 |
4.2.2 Hive约定 |
4.2.3 STG层 |
4.2.4 ODS层 |
4.2.5 PDW层 |
4.2.6 ADM层 |
4.3 政务数据质量治理模型实现 |
4.3.1 数据质量规则 |
4.3.2 质量反馈闭环 |
4.4 政务海量数据增量采集实现 |
4.4.1 全量数据采集 |
4.4.2 时间戳增量采集 |
4.4.3 全表比对增量采集 |
4.4.4 NICDC增量采集 |
4.5 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
个人简历 |
在学期间学术成果和参与项目 |
致谢 |
(5)停车管理数据仓库构建与可视化分析(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究动态 |
1.3 研究内容 |
1.4 研究方法与技术路线 |
1.5 论文结构安排 |
第二章 商务智能相关理论及方法 |
2.1 商务智能主要理论 |
2.1.1 商务智能概念 |
2.1.2 商务智能核心架构 |
2.2 商务智能主要技术方法 |
2.2.1 ETL技术 |
2.2.2 数据仓库技术 |
2.2.3 联机分析处理技术 |
2.2.4 数据挖掘技术 |
2.2.5 报表展示技术 |
2.3 数据可视化理论及方法 |
2.3.1 数据可视化技术概述 |
2.3.2 基于数据仓库的数据报表技术 |
2.3.3 动态可视化技术 |
2.4 本章小结 |
第三章 基于停车管理的数据仓库设计与构建 |
3.1 业务需求分析 |
3.2 数据仓库设计 |
3.2.1 概念模型设计 |
3.2.2 逻辑模型设计 |
3.2.3 物理模型设计 |
3.3 ETL流程设计 |
3.3.1 数据抽取设计 |
3.3.2 数据清洗与转换设计 |
3.3.3 数据加载设计 |
3.4 本章小结 |
第四章 停车数据的可视化分析 |
4.1 基于数据仓库的数据报表系统设计与展示 |
4.1.1 报表主题分析与设计 |
4.1.2 报表设计 |
4.1.3 报表展示 |
4.1.4 报表的部署与管理 |
4.2 停车管理数据的可视化展示 |
4.2.1 可视化技术方法的比较与选择 |
4.2.2 规划目标分析以及应用软件设置 |
4.2.3 基于前端技术软件的停车数据可视化分析 |
4.3 本章小结 |
第五章 总结与展望 |
5.1 研究结论 |
5.2 研究展望 |
参考文献 |
致谢 |
附录 |
作者简介 |
(6)基于Hadoop的移动互联网用户与制造业从业情况的大数据分析系统的设计(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 绪论 |
1.1 选题背景 |
1.2 大数据处理技术研究现状 |
1.3 论文章节安排与需要完成的工作 |
2 系统的需求分析 |
2.1 系统的业务需求分析 |
2.2 系统的功能性需求分析 |
2.2.1 新增用户分析功能模块 |
2.2.2 活跃用户分析功能模块 |
2.2.3 用户行为指标分析功能模块 |
2.3 系统的非功能性需求分析 |
2.3.1 系统可用性 |
2.3.2 系统易用性 |
2.3.3 系统计算时效性 |
2.3.4 系统的容错性 |
2.4 本章小结 |
3 移动互联网用户数据ETL技术选型 |
3.1 数据ETL技术 |
3.1.1 传统ETL技术 |
3.1.2 面向大数据的分布式ETL框架 |
3.2 Hadoop技术 |
3.2.1 分布式文件系统HDFS |
3.2.2 Map Reduce批处理技术 |
3.3 Hive数据仓库技术 |
3.4 关系型数据库技术 |
3.5 本章小结 |
4 用户与制造业行业分析系统的设计 |
4.1 系统整体技术构架 |
4.2 分布式数据ETL系统的设计 |
4.2.1 数据抽取模块的设计 |
4.2.2 分布式计算框架软件构架设计 |
4.2.3 数据转换与加载模块设计 |
4.3 数据仓库设计 |
4.3.1 数据仓库建模方法选择 |
4.3.2 大数据分析系统的数据仓库主题分析 |
4.3.3 数据仓库物理设计 |
4.4 本章小结 |
5 系统实现与上线运行 |
5.1 关键指标计算逻辑实现 |
5.2 Hive配置项 |
5.3 系统运行测试 |
5.3.1 数据ETL过程 |
5.3.2 数据分析计算过程 |
5.4 本章小结 |
6 用户活跃分析与制造业从业分析结论 |
6.1 大数据分析系统计算结果web展示 |
6.1.1 用户新增模块 |
6.1.2 用户活跃模块 |
6.1.3 用户点击行为分析模块 |
6.2 用户分析与制造业行业从业分析 |
6.2.1 用户分布分析 |
6.2.2 行业关注情况分析 |
6.2.3 制造业从业情况分析 |
6.2.4 制造业从业收入分析 |
6.3 系统运行评估 |
6.3.1 功能性评估 |
6.3.2 非功能性评估 |
6.4 结论 |
6.4.1 视频平台运营与用户数据计算分析结论 |
6.4.2 用户制造业从业情况分析结论 |
6.4.3 大数据系统上线运行结论 |
6.5 本章小结 |
7 总结与展望 |
7.1 全文总结 |
7.2 展望 |
参考文献 |
(7)混合式教学环境下学习分析系统的设计及实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 关于学习分析技术的研究 |
1.2.2 关于学习分析平台的研究 |
1.3 研究内容与意义 |
1.4 论文结构 |
第二章 相关研究综述 |
2.1 数据仓库 |
2.1.1 数据仓库介绍 |
2.1.2 数据仓库架构 |
2.1.3 数据仓库建模方法 |
2.1.4 数据仓库特点与价值 |
2.2 学习分析 |
2.2.1 学习分析回答了什么? |
2.2.2 学习分析的通用模型 |
2.2.3 学习分析的现状及挑战 |
第三章 数据建模与数据量化 |
3.1 数据预处理 |
3.2 学习平台数据建模量化 |
3.2.1 学习平台页面建模 |
3.2.2 学习平台行为量化 |
3.3 QQ聊天数据建模 |
3.3.1 单主题抽取模型 |
3.3.2 多主题拆分模型 |
3.3.3 实验参数与准确率 |
3.4 时间维度数据建模 |
第四章学习分析系统的设计 |
4.1 需求分析 |
4.1.1 用户需求 |
4.1.2 功能需求 |
4.1.3 系统需求 |
4.2 数据仓库建设 |
4.2.1 数据仓库高层建模——信息包图 |
4.2.2 数据仓库中层建模——雪花模型 |
4.2.3 数据仓库底层建模——数据统一化 |
4.2.4 数据仓库层级建设 |
4.3 预警模型建设 |
4.4 系统架构设计 |
4.5 功能模块设计 |
4.5.1 基础查询模块 |
4.5.2 相关性分析 |
4.5.3 学习预警 |
第五章 系统测试与实际案例可行性检验 |
5.1 基础查询模块案例分析 |
5.1.1 学习平台数据展现 |
5.1.2 学生的平台数据统计图表 |
5.2 学习过程性分析模块案例分析 |
5.2.1 学习状况分析图表 |
5.2.2 QQ聊天分析图表 |
5.3 学习预警与相关性分析模块案例分析 |
5.3.1 学习预警图表 |
5.3.2 相关性分析 |
第六章 总结与展望 |
参考文献 |
致谢 |
作者攻读学位期间发表的学术论文目录 |
(8)基于Hive的电商多维分析系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 论文课题背景 |
1.2 国内外研究现状 |
1.3 论文主要工作 |
1.4 论文组织架构 |
第二章 电商多维分析系统的关键技术 |
2.1 Hadoop简介 |
2.1.1 HDFS分布式文件系统 |
2.1.2 Mapreduce分布式计算框架 |
2.2 Hive数据仓库构建 |
2.2.1 Hive架构原理 |
2.2.2 Hive运行机制 |
2.2.3 数据仓库实施步骤 |
2.3 ETL技术简介 |
2.4 Druid即席查询 |
2.5 其他技术 |
第三章 电商多维分析系统的需求分析 |
3.1 系统概况 |
3.1.1 系统建设目标 |
3.1.2 建设原则 |
3.2 系统功能性需求分析 |
3.3 系统非功能性需求分析 |
第四章 电商多维分析系统概要设计 |
4.1 系统总体技术架构 |
4.2 系统基础平台设计 |
4.2.1 原始数据采集模块设计 |
4.2.2 平台数据存储模块设计 |
4.2.3 多源数据计算模块设计 |
4.3 系统OLAP设计 |
4.3.1 系统数据仓库层次 |
4.3.2 数据仓库的原始数据层 |
4.3.3 数据仓库的明细数据层 |
4.3.4 数据仓库的服务数据层 |
4.3.5 数据仓库的业务数据层 |
第五章 电商多维分析系统的实现 |
5.1 电商多维分析系统技术实现 |
5.2 电商多维分析子系统ETL实现 |
5.2.1 Flume日志采集详细实现 |
5.2.2 Sqoop结构化数据采集详细实现 |
5.3 电商多维分析系统数据仓库详细实现 |
5.3.1 ODS层数据仓库具体实施 |
5.3.2 DWD层数据仓库具体实施 |
5.3.3 DWS层数据仓库具体实施 |
5.3.4 ADS层数据仓库具体实施 |
5.4 用户行为多维维分析设计详细实现 |
5.4.1 活跃度用户具体实现及效果展示 |
5.4.2 忠诚用户分析实现及效果展示 |
5.4.3 用户转化率具体实现及效果展示 |
5.4.4 交易行为GMV统计分析具体实现及效果展示 |
第六章 系统测试 |
6.1 基于CDH的系统环境搭建 |
6.1.1 硬件平台 |
6.1.2 软件环境 |
6.1.3 集群部署 |
6.2 Azkaban全自动流水化任务调度 |
6.3 系统测试与验证 |
6.3.1 功能性验证测试 |
6.3.2 非功能性验证测试 |
第七章 总结与展望 |
7.1 论文总结 |
7.2 论文展望 |
参考文献 |
致谢 |
作者简介 |
1 作者简历 |
2 发明专利 |
学位论文数据集 |
(9)大数据在基层税收征管上的应用研究(论文提纲范文)
摘要 |
abstract |
1 前言 |
1.1 研究背景及目的 |
1.2 主要内容与研究方法 |
1.3 文献综述 |
1.3.1 国外文献综述 |
1.3.2 国内文献综述 |
1.3.3 文献研究评价 |
1.4 创新之处与研究不足 |
2 相关概念与理论基础 |
2.1 相关概念 |
2.1.1 大数据 |
2.1.2 税收征管 |
2.1.3 大数据与税收征管的联系 |
2.2 理论基础 |
2.2.1 信息不对称理论 |
2.2.2 风险管理理论 |
3 大数据应用于基层税收征管的现状及存在的问题 |
3.1 基层开展大数据税收征管的基本要求与条件限制 |
3.1.1 大数据下基层税收征管的基本要求 |
3.1.2 大数据下基层税收征管的条件限制 |
3.2 大数据在基层税收征管的应用现状 |
3.2.1 数据采集与整合 |
3.2.2 税源的专业化管理 |
3.2.3 重设风险管理股室 |
3.2.4 智能税务优化纳税服务 |
3.3 大数据应用于基层税收征管存在的问题 |
3.3.1 涉税信息采集和整合问题 |
3.3.2 大数据背景下税源监控不足 |
3.3.3 税收风险管理水平不高 |
3.3.4 信息化人才队伍缺乏 |
4 大数据在基层税收征管中的应用模拟 |
4.1 数据仓库技术在涉税信息采集与整合中的应用 |
4.1.1 应用数据仓库技术实现数据采集与整合 |
4.1.2 应用总结 |
4.2 K-MEANS聚类在税源管理中的应用 |
4.2.1 数据的收集与指标的选取 |
4.2.2 运行情况评价 |
4.2.3 应用总结 |
4.3 SQL语言查询并提取数据 |
4.3.1 SQL语言的应用模拟 |
4.3.2 应用总结 |
5 推进大数据应用于基层税收征管的建议 |
5.1 加强数据信息管理,搭建数据仓库平台 |
5.2 加大税源监控力度,完善数据挖掘流程 |
5.3 实现科学纳税评估,提高风险管理水平 |
5.4 建设信息化队伍,助力大数据技术运用 |
6 总结 |
参考文献 |
致谢 |
(10)基于数据挖掘的互联网金融风控评价研究(论文提纲范文)
学位论文数据集 |
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究的目的和意义 |
1.2.1 研究的目的 |
1.2.2 研究的意义 |
1.3 研究的方法 |
1.3.1 研究的方法 |
1.3.2 论文的结构 |
1.4 研究的平台-移动互联网 |
1.5 本文可能的创新 |
第2章 互金贷前风控评价理论基础与文献综述 |
2.1 互金贷前风控评价的关键理论和技术 |
2.1.1 网络借贷类互联网金融 |
2.1.2 互金贷前风控评价 |
2.1.3 行为金融学及行为金融学与互金贷前风控的关系 |
2.1.4 数据挖掘 |
2.1.5 数据仓库 |
2.1.6 ID3决策树算法 |
2.1.7 C4.5决策树算法 |
2.1.8 Weka |
2.3 风控评价国内外研究综述 |
2.3.1 美国FICO评分系统 |
2.3.2 前海征信 |
第3章 互金贷前风控评价指标构建和价值分析 |
3.1 互金贷前风控评价指标的构建依据 |
3.1.1 业务场景 |
3.1.2 指标的真实性和客观性 |
3.1.3 指标的合法性 |
3.4 互金贷前风控评价指标构建 |
3.4.1 基本认证信息及价值分析 |
3.4.2 高级认证信息及价值分析 |
3.4.3 生物识别数据及价值分析 |
3.4.4 借还款数据及价值分析 |
3.4.5 行为数据及价值分析 |
第4章 互金贷前风控评价模型的构建 |
4.1 构建数据仓库 |
4.1.1 数据来源 |
4.1.2 建立维度表 |
4.1.3 建立事实表 |
4.1.4 数据处理 |
4.2 创建并测试模型 |
4.3 测试风控评价模型 |
第5章 贷前风控评价模型对于互金企业的启示和建议 |
5.1 贷前风控评价模型对于借贷互金企业管理上的价值和意义 |
5.1.1 有效降低企业成本 |
5.1.2 增加企业利润 |
5.1.3 打造借贷互金企业的核心竞争力 |
5.1.4 减少了贷前风控审批层级,促成组织效率提升和资金周转率的提升 |
5.1.5 提升了企业贷前风控流程的客观性 |
5.2 贷前风控评价模型对于企业管理上的启示 |
5.2.1 借贷类企业贷前风控的中立性 |
5.2.2 对成本和效率的要求是企业管理中的一项重要目标 |
5.2.3 对企业管理中贷前风控监控有了更高要求 |
5.3 贷前风控评价在实验过程中的几个亟待解决的问题 |
5.4 风控评价关于改进和改善的几点建议 |
5.4.1 风控数据孤岛问题 |
5.4.2 隐私问题 |
5.4.3 区块链技术的引入 |
5.4.4 银行对于风控评价起到的作用 |
第6章 总结和展望 |
6.1 结论 |
6.2 研究不足及展望 |
参考文献 |
致谢 |
导师及作者简介 |
专业学位硕士研究生学位论文答辩委员会决议书 |
四、数据仓库技术特点及相关问题讨论(论文参考文献)
- [1]中国近代工业建筑营建过程关键性技术问题研究(1840-1949)[D]. 赖世贤. 天津大学, 2020
- [2]教师研修社区学习者模型构建及应用研究 ——以“A”教师培训平台为个案[D]. 王冬冬. 东北师范大学, 2020(07)
- [3]基于敏捷思想的数据仓库云化项目风险管理研究[D]. 张宜建. 北京邮电大学, 2020(05)
- [4]大数据仓库数据模型在电子政务中的应用研究[D]. 郑丹辉. 郑州大学, 2020(02)
- [5]停车管理数据仓库构建与可视化分析[D]. 李伟超. 西安电子科技大学, 2020(05)
- [6]基于Hadoop的移动互联网用户与制造业从业情况的大数据分析系统的设计[D]. 梁旺. 浙江大学, 2020(06)
- [7]混合式教学环境下学习分析系统的设计及实现[D]. 张颢译. 北京邮电大学, 2020(05)
- [8]基于Hive的电商多维分析系统的设计与实现[D]. 贾翼. 浙江工业大学, 2020(08)
- [9]大数据在基层税收征管上的应用研究[D]. 宋敏. 西南财经大学, 2019(07)
- [10]基于数据挖掘的互联网金融风控评价研究[D]. 韩晓峰. 北京化工大学, 2018(06)