计算机基础
TXT:纯文本格式,在不同操作系统之间可以通用,兼容于不同的文字处理软件。因为无文件头,所以不易被病毒感染。 Doc:Microsoft Office生成的文档格式 XLS:Excel电子表格文件 WPS:国产文字处理软件WPS声称的文档格式
Bmp:Windows自带的图片格式,数据量大显像清晰 GIF:最大的特点是提供了压缩功能,使多幅任意大小的图片保存在一个文件中,形成动画的图片文件,且颜色数只有256,文件小 Jpg:具有较高压缩比的图片文件,压缩过程中的失真程度很小,目前使用范围广泛,特点是,文件小、颜色数和分辨率高。 PSD:Photoshop格式文件
MPEG/Mpg:采用MPEG(中间帧)压缩方式的视频文件,是目前最常见的视频文件,可以对包括声音在内的移动图像以1:100的比率进行压缩,并且它还支持1024 X 768 的分辨率、CD音质播放、每秒30帧的播放速度等优秀功能 AVI:对视频文件采用一种有损压缩方式,该方式的压缩率较高,并可将音频和视频混合到一起使用,因此尽管画面质量一般,但仍然应用广泛。支持256色和RLE压缩。 MOV:苹果机一直到PC机的视频文件,采用了有损压缩方式,但效果较AVI要好一些。 DAT:常见的VCD、CD光盘存储的视频文件格式 FLV:流行的网络视频格式,数据量小,适合网络传输
WAV:最常见的声音文件,是微软公司专门为Windows开放的一种标准数字音频文件(又称波形文件),能保证声音不失真,但占用磁盘空间太大(音乐12M/Min) MID/MIDI:国际MIDI协会开发的乐器数字接口文件,它能将乐器所奏出来的声音数字化,然后在播放时再对数字进行转化,因此占用的磁盘空间非常小,但效果一般,Mid文件适用于记录乐曲旋律,而不适合于对歌曲进行处理。目前Mid文件主要靠硬件生成,依靠软件合成Mid文件的技术还不完善。 MP3:目前最热门的音乐文件,它能以较小的比特率、较大的压缩率达到近乎完美的CD音质(压缩率可达1:12,音乐1M/min) WMA:压缩率比MP3高,占用空间更小,但音质比MP3差一些
HTML:超文本标识语言生成的网页文件 Zip、Arj、Jar、Rar:压缩包文件 pdf:一种非常流行的文档文件,最大的特点是在任何操作系统下都能正常显示。
Bak:系统备份文件(WBK是word的备份文件、XLK是Excel的辈分文件) TMP:最常见的临时文件,一般没有多大使用价值。 Log:日志文件,对有关应用程序的运行状况进行记录

数据的分类方式
下面将逐个介绍各种常见分类方式,并简单介绍每种分类的使用场景,以及对每个角色的重要程度。
(1)从字段类型上:文本类(string、char、text等)、数值类(int、float、number等)、时间类(data、timestamp等)
这种分类方式是最基本的,和很多场景有关。其一在系统设计时,需要确定每个字段的类型,以便设计数据库结构。其二,在数据清洗时,文本类数据往往很难清洗,而且很多文本类数据也没有清洗的必要,比如备注或客户评论。数值类和时间类数据是清洗的重点,这类字段在业务上一般都有明确的取值范围,比如年龄必须大于0。对于不合法的取值,通常用默认值填充。其三,在建立维度模型时,数值类中的编码型字段和时间类字段通常作为维度,数值类中的量化属性作为度量。
(2)从数据结构上:结构化数据、半结构化数据、非结构化数据
这种分类方式近几年特别重要,相关的场景包括:其一,结构化数据是传统数据的主体,而半结构化和非结构化数据是大数据的主体。后者的增长速度比前者快很多,大数据的量这么大,主要是因为半结构化和非结构化数据的增长速度太快。其二,在数据平台设计时,结构化数据用传统的关系数据库便可高效处理,而半结构化和非结构化数据必须用Hadoop等大数据平台。其三,在数据分析和挖掘时,不少工具都要求输入结构化数据,因此必须把半结构化数据先转换成结构化数据。
(3)从描述事物的角度:状态类数据、事件类数据、混合类数据
这种分类方式在数据仓库建模是特别重要。数据仓库需要保存各种历史数据,不同类型的历史数据保存方式差别很大。状态类数据保存历史的方式一般有两种:存储快照或者SCD方式。事件类数据一旦发生就已经是历史了,只需直接存储或者按时间分区存储。混合类数据保存历史比较复杂,可以把变化的字段分离出来,按状态类数据保存,剩下不变的则按事件类数据保存,使用时再把两者合并。另一个相关场景就客户画像,客户画像通常用状态类数据,对于和客户相关的事件类数据和混合类数据,也会转换成和状态类数据相同的形态。
(4)从数据处理的角度:原始数据、衍生数据
这种分类方式主要用在管理数据上,对原始数据的管理和衍生数据的管理有一些差别。原始数据通常只要保留一份,衍生数据却不同,管理形式比较灵活,只要有利于提高数据分析和挖掘效率,产生更大的数据价值,任何形式都可以尝试。比如为每个业务条线定制个性化数据集市,提高每个业务条线的数据分析效率,虽然不同集市存在大量冗余的数据,但只要能大幅提高分析效率,用空间换时间也未尝不可。
(5)从数据粒度上:明细数据、汇总数据
这种分类方式的相关场景有两种,一种是在数据仓库设计时,如何对数据进行汇总,按什么方式进行汇总,才能达到使用效率和汇总成本的平衡。另一种是数据分析人员在分析数据时,在明细数据、各种汇总数据之间选择合适的数据,以提高分析效率。
(6)从更新方式上:批量数据、实时数据
这种分类方式也非常重要,目前有越来越多系统采取该方式提供数据。这对数据处理、数据分析和数据应用产生了巨大的影响。一方面能为业务提供近乎实时的数据和报表支持,实现高时效的业务场景。另一方面也极大地增加了数据架构、数据分析和应用的技术难度。
计算机应用基础
19、有线局域网中的主流技术是()技术,是最早符合IEEE8023标准的局域网技术之一。(1.0)
20、在Excel中,利用()函数可以使得条件成立时得到一种结果,不成立得到另一种结果(函数名请用大写)(1.0)
1、配置高速缓冲存储器____是为了解决CPU与内存储器之间速度不匹配问题。____(1.0)
2、在考生文件夹下INSIDE文件夹中创建名为PENG的文件夹,并设置为隐藏属性。(1)打开考生文件夹下INSIDE文件夹;(2)单击鼠标右键,弹出快捷菜单,选择【新建】|【文件夹】命令,完成新文件夹的创建,并编辑名称为题目指定的名称PENG;(3)选中PENG文件夹;(4)单击鼠标右键,弹出快捷菜单,选择“_____”命令打开属性对话框;(5)在属性对话框中勾选“隐藏”属性,单击“确定”按钮。(1.0)
2、在考生文件夹下INSIDE文件夹中创建名为PENG的文件夹,并设置为隐藏属性。(1)打开考生文件夹下INSIDE文件夹;(2)单击鼠标右键,弹出快捷菜单,选择【新建】|【文件夹】命令,完成新文3、在Windows7中,一个软件要能正常运行,就必须先进行()。(1.0)
4、将正文各段文字(农业部今天向……技术途径。";)设置为四号仿宋,首行缩进2字符,行距为15倍行距。步骤:选中正文各段,在【开始】功能区的【字体】分组中,单击“字体”按钮,弹出“字体”对话框。在“字体”选项卡中,设置“中文字体”为“仿宋”,设置“字号”为“四号”,单击“确定”按钮。在【开始】功能区的【_____】分组中,单击“段落”按钮,弹出“段落”对话框。单击“缩进和间距”选项卡,在“缩进”选项组中,选择“首行缩进”选项,设置磅值为“字符”,在“间距”选项组中,设置“行距”为“15倍行距”,单击“确定”按钮。(1.0)
4、将正文各段文字(农业部今天向……技术途径。";)设置为四号仿宋,首行缩进2字符,行距为15倍行距。步骤:选中正文各段,在【开始】功能区的【字体】分组中,单击“字体”按钮,弹出“字体”对话框。在“字体”选项卡中,设置“中文字体”为“仿宋”,设置“字号”为“四号”,单击“确定”按钮。在【开始】功能区的【_____】分组中,单击“段落”按钮,弹出“段落”对话框。单击“缩进和间距”选项卡,在“缩进”5、要使当前编辑的word文档中的所有段落段前空两个字符,应使用_____功能。(1.0)
6、半角方式下,英文字符占1个显示位即1个字符宽。在全角方式下,英文字符和汉字均占用()个字符宽度。(括号中填写数字)(1.0)
7、对数据进行加工处理并赋予一定的意义之后,便成为了()。(1.0)
8、一个工作簿可由多张工作表组成,在Excel2010中新建一个工作簿,默认的工作表有()个。(1.0)
9、如要设计一个选择查询,显示“总评”在90及以上的查询结果,应在“总评”字段下方的()行,输入条件“>;=90”(1.0)
10、()是法国的一位数学家,他在19岁发明了第一台机械计算机,用来帮助父亲完成繁重的计算工作。(1.0)
11、请将Excel数据输入口诀补充完整(注意:标点符号用汉字描述,英文字母均用小写):文本也不难,()字首当先。换行加(),使劲往里钻。(1.0)
11、请将Excel数12、word2010中的“分栏”功能在_____选项卡中(1.0)
13、单元格区域A3:C5一共包含()个单元格。(1.0)
14、Excel2010中单元格区域A3:C5一共包含()个单元格。(1.0)
15、在单元格输入分数时,需要在输入之前先输入()和空格。(1.0)
16、超文本标记语言的英文缩写为(),来定义文档的结构和格式(1.0)
17、访问WWW的协议是()(1.0)
18、在Excel中,A1,B1,C1,D1的内容分别为1,2,3,4。则函数COUNT____的结果是4。____(1.0)
20、()服务器能把域名翻译成IP地址()(1.0)
