大数据与审计属于什么专业类别?
大数据属于数学一类的专业,相关专业名称有信息与计算科学、数学与应用数学、统计学,大数据是众多学科与统计学交叉产生的一门新兴学科,大数据牵扯的数据挖掘、云计算一类的,所以是数学一类的专业。
(1)统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
(2)数学与应用数学是一个学科专业,该专业培养掌握数学科学的基本理论与基本方法,具备运用数学知识、使用计算机解决实际问题的能力,受到科学研究的初步训练。能在科技、教育和经济部门从事研究、教学工作或在生产经营及管理部门从事实际应用、开发研究和管理工作的高级专门人才。
(3)信息与计算科学专业是以信息领域为背景用将迈向的数学与信息,管理相结合的交叉学科更深入和专业。
大数据专业简介
大数据专业将从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地帮助企业掌握大数据应用中的各种典型问题的解决办法,包括实现和分析协同过滤算法、运行和学习分类算法、分布式Hadoop集群的搭建和基准测试、分布式Hbase集群的搭建和基准测试、实现一个基于、Mapreduce的并行算法、部署Hive并实现一个的数据操作等等,实际提升企业解决实际问题的能力。
大数据领域对于人才的需求总量大、层次多、范围广,产业对于人才的需求呈井喷式增长,相关行业拥有海量的岗位需求。
推荐教程:《PHP》
想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?
谢邀!笔者刚签约大数据挖掘工程师岗位,也是在研究生阶段才转为大数据方向。大数据目前正火热,很多同学想要转入,但学习路线对于自学的人来讲因人而异。
拿自身举例,笔者之前是Python数据分析出生,编程能力一般,因此在这个基础上先学习linux基本操作命令,安装ubuntu双系统并进一步安装Hadoop和Spark组件,在此基础上利用Pyspark操作Spark大数据框架进行学习。可以推荐如下书籍:
《Pyspark实战指南》
而要完全进入大数据领域还不够,因为大数据框架比较侧重开发,所以需要有scala语言功底(scala语言是Spark的原生语言),而scala语言跟JAVA关联性很强且完全兼容,所以如果有一定JAVA基础的话完全可以从scala入手,推荐的书籍如下:
《Spark编程基础(scala版)》
视频教程强烈推荐林子雨老师在MOOC慕课上的国家精品免费课程,由浅入深,非常容易上手。
大数据学习可以从最基础的java语言入手,然后去学习Linux&Hadoop生态体系,一些分布式的技术理念,再然后就是学习机器学习,深度学习算法。
阶段一、大数据基础——java语言基础方面
(1)Java语言基础
Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类
(2)JavaWeb和数据库
数据库、JavaWeb开发核心、JavaWeb开发内幕
推荐书籍:
《Effective Java中文版》(第2版)
这本书是学习java必备书籍,看完这本书也就掌握了入门的基础知识。
阶段二、 Linux&Hadoop生态体系
学习大数据离不开hadoop,围绕hadoop有一套生态体系,分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架需要了解并掌握。
推荐书籍:
1、《Big Data》
2、《Hadoop权威指南》
3、《Hive编程指南》
阶段三、 分布式计算。
(1)分布式计算框架
Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算等
(2)storm技术架构体系
Storm原理与基础、消息队列kafka、Redis工具、zookeeper集群
推荐书籍:
1、《Learning Spark》
2、《Spark机器学习:核心技术与实践》
阶段四、机器学习和深度学习算法的学习,可以更好的利用大数据去处理问题。
作为一名IT从业者,同时也是一名教育工作者,我来回答一下这个问题。
首先,要自学大数据还是具有一定难度的,大数据不仅内容比较多,难度比较高,同时还需要学习者具有一定的场景支撑,比如数据中心等等,所以初学者自学大数据通常需要按照三个阶段来安排学习计划。
学习大数据的第一个阶段要根据自身的知识基础和发展方向来完成一些基础知识的学习,不论是从事大数据开发还是大数据分析,都需要具有一定的程序设计基础,初学者从Java和Python开始学起都是不错的选择。Java的前期学习难度要大一些,Python则要相对简单一些,而且目前Python语言在大数据领域的应用前景也比较广阔。
学习大数据的第二个阶段是掌握大数据平台的相关知识,大数据领域的诸多岗位任务都离不开大数据平台的支撑,所以学习大数据平台是学习大数据技术的重要环节。学习大数据平台可以从Hadoop和Spark开始学起,一方面这两个平台是开源平台,另一方面这两个平台的应用范围也比较广泛,相关的学习案例也比较多。
相对于编程语言来说,大数据平台的内容相对比较多,而且也具有一定的难度,往往还需要初学者具备一定的Linux操作系统知识,所以如果自身的计算机基础知识比较薄弱,那么也可以从Linux操作系统开始学起。
学习大数据的第三个阶段就是实践阶段,实践阶段最好能够在实习岗位上来完成,一方面实习岗位能够提供场景支撑,另一方面在实习岗位上也更容易与有经验的技术人员进行交流学习。
我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。
如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以在评论区留言,或者私信我!

