首页 > 厂商 > 知识 > 分布式文件系统,dfs是什么

分布式文件系统,dfs是什么

来源:整理 时间:2024-12-09 01:36:12 编辑:智能门户 手机版

1,dfs是什么

分布式文件
分布式文件系统

dfs是什么

2,什么是分布式文件系统

Microsoft文件分布系统 (Dfs) 是一个网络服务器组件,它能够使你更容易地在网络上查询和管理数据。分布式文件系统是将分布于不同电脑上的文件组合为单一的名称空间,并使得在网络上建立一个单一的、层次化多重文件服务器和服务器共享的工作更为方便的途径。详细信息: http://www.microsoft.com/china/windows2000/library/howitworks/fileandprint/Dfsnew.mspx

什么是分布式文件系统

3,什么是Hadoop分布式文件系统

分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。Hadoop是Apache软件基金会所研发的开放源码并行运算编程工具和分散式档案系统,与MapReduce和Google档案系统的概念类似。HDFS(Hadoop 分布式文件系统)是其中的一部分。
一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。
一台一台的电脑上你都装好了hadoop,每台电脑有相同的用户名,密码。然后其中一台电脑作为master其余电脑作为slave(这个要在安装hadoop后进行配置)。在master这台电脑上启动hadoop,其余的电脑也就都跟着启动了。这样当你把文件导入到hadoop的时候,这个文件是分布的存储在你的这些hadoop电脑上的,至于怎么存,存在哪几台电脑,我们是不需要关心的,会自动给我们处理。这就是所谓的hadoop分布式文件系统。希望能帮到你~~~:)
Hdfs分布式文件系统 就是hadoop开源云平台中的文件系统,是其最关键的技术 解决文件分块存储、索引等

什么是Hadoop分布式文件系统

4,什么是DFS分布式文件系统以及DFS的优点

通过 DFS(分布式文件系统),一台服务器上的某个共享点能够作为驻留在其他服务器上的共享资源的宿主。DFS 以透明方式链接文件服务器和共享文件夹,然后将其映射到单个层次结构,以便可以从一个位置对其进行访问,而实际上数据却分布在不同的位置。用户不必再转至网络上的多个位置以查找所需的信息,而只需连接到: \\DfsServer\Dfsroot 用户在访问此共享中的文件夹时将被重定向到包含共享资源的网络位置。这样,用户只需知道 DFS 根目录共享即可访问整个企业的共享资源。 DFS 拓扑从 DFS 树的根目录开始。位于逻辑层次结构顶部的 DFS 根目录映射到一个物理共享。DFS 链接将域名系统 (DNS) 名称映射到目标共享文件夹或目标 DFS 根目录的 UNC 名称。当 DFS 客户端访问 DFS 共享文件夹时,DFS 服务器将 DNS 名称映射到 UNC 名称并将引用返回给该客户端,以使它能够找到共享文件夹。将 DNS 名称映射到 UNC 名称使数据的物理位置对用户是透明的,这样用户便无须记住存储文件夹的服务器。当 DFS 客户端请求 DFS 共享的引用时,DFS 服务器将使用分区情况表 (PKT) 将 DFS 客户端定向到物理共享。对于基于域的 DFS,PKT 存储在 Active Directory 中;对于独立的 DFS,PKT 存储在注册表中。在网络环境中,PKT 维护有关 DFS 拓扑的所有信息,包括其到基础物理共享的映射。DFS 服务器将 DFS 客户端定向到与请求的 DFS 链接相对应的副本共享列表后,DFS 客户端使用 Active Directory 站点拓扑连接到同一站点中的一个副本,如果该站点中没有提供副本,则连接到该站点以外的一个副本。 分布式软件系统(Distributed Software Systems)是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。它包括分布式操作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分布式数据库系统等。 分布式操作系统负责管理分布式处理系统资源和控分布式系统的类型,大致可以归为三类: 1、分布式数据,但只有一个总? 据库,没有局部数据库。 2、分层式处理,每一层都有自己的数据库。 3、充分分散的分布式网络,没有中央控制部分,各节点之间的联接方式又可以有多种,如松散的联接,紧密的联接,动态的联接,广播通知式联接等。

5,什么是分布式文件系统HDFS

HDFS是基于流数据模式访问和处理超大文件的需求而开发的,它可以运行于廉价的商用服务器上。总的来说,可以将 HDFS的主要特点概括为以下几点:(1 )处理超大文件这里的超大文件通常是指数百 MB、甚至数百TB 大小的文件。目前在实际应用中, HDFS已经能用来存储管理PB(PeteBytes)级的数据了。在 Yahoo!,Hadoop 集群也已经扩展到了 4000个节点。(2 )流式地访问数据HDFS的设计建立在更多地响应“一次写入,多次读取”任务的基础之上。这意味着一个数据集一旦由数据源生成,就会被复制分发到不同的存储节点中,然后响应各种各样的数据分析任务请求。在多数情况下,分析任务都会涉及数据集中的大部分数据,也就是说,对HDFS 来说,请求读取整个数据集要比读取一条记录更加高效。(3 )运行于廉价的商用机器集群上Hadoop设计对硬件需求比较低,只须运行在廉价的商用硬件集群上,而无须昂贵的高可用性机器上。廉价的商用机也就意味着大型集群中出现节点故障情况的概率非常高。这就要求在设计 HDFS时要充分考虑数据的可靠性、安全性及高可用性。正是由于以上的种种考虑,我们会发现现在的 HDFS在处理一些特定问题时不但没有优势,而且有一定的局限性,主要表现在以下几个方面。(1 )不适合低延迟数据访问如果要处理一些用户要求时间比较短的低延迟应用请求,则 HDFS不适合。HDFS 是为了处理大型数据集分析任务的,主要是为达到高的数据吞吐量而设计的,这就可能要求以高延迟作为代价。目前有一些补充的方案,比如使用HBase,通过上层数据管理项目来尽可能地弥补这个不足。(2 )无法高效存储大量小文件在Hadoop 中需要用 NameNode来管理文件系统的元数据,以响应客户端请求返回文件位置等,因此文件数量大小的限制要由 NameNode来决定。例如,每个文件、索引目录及块大约占 100字节,如果有100 万个文件,每个文件占一个块,那么至少要消耗 200MB内存,这似乎还可以接受。但如果有更多文件,那么 NameNode的工作压力更大,检索处理元数据的时间就不可接受了。(3 )不支持多用户写入及任意修改文件在HDFS 的一个文件中只有一个写入者,而且写操作只能在文件末尾完成,即只能执行追加操作。目前 HDFS还不支持多个用户对同一文件的写操作,以及在文件任意位置进行修改。
microsoft文件分布系统 (dfs) 是一个网络服务器组件,它能够使你更容易地在网络上查询和管理数据。分布式文件系统是将分布于不同电脑上的文件组合为单一的名称空间,并使得在网络上建立一个单一的、层次化多重文件服务器和服务器共享的工作更为方便的途径。详细信息:http://www.microsoft.com/china/windows2000/library/howitworks/fileandprint/dfsnew.mspx

6,分布式文件系统的系统分类

(DFS) 是AFS的一个版本,作为开放软件基金会(OSF)的分布式计算环境(DCE)中的文件系统部分。如果文件的访问仅限于一个用户,那么分布式文件系统就很容易实现。可惜的是,在许多网络环境中这种限制是不现实的,必须采取并发控制来实现文件的多用户访问,表现为如下几个形式:只读共享 任何客户机只能访问文件,而不能修改它,这实现起来很简单。受控写操作 采用这种方法,可有多个用户打开一个文件,但只有一个用户进行写修改。而该用户所作的修改并不一定出现在其它已打开此文件的用户的屏幕上。并发写操作 这种方法允许多个用户同时读写一个文件。但这需要操作系统作大量的监控工作以防止文件重写,并保证用户能够看到最新信息。这种方法即使实现得很好,许多环境中的处理要求和网络通信量也可能使它变得不可接受。NFS和AFS的区别NFS和AFS的区别在于对并发写操作的处理方法上。当一个客户机向服务器请求一个文件(或数据库记录),文件被放在客户工作站的高速缓存中,若另一个用户也请求同一文件,则它也会被放入那个客户工作站的高速缓存中。当两个客户都对文件进行修改时,从技术上而言就存在着该文件的三个版本(每个客户机一个,再加上服务器上的一个)。有两种方法可以在这些版本之间保持同步:无状态系统 在这个系统中,服务器并不保存其客户机正在缓存的文件的信息。因此,客户机必须协同服务器定期检查是否有其他客户改变了自己正在缓存的文件。这种方法在大的环境中会产生额外的LAN通信开销,但对小型LAN来说,这是一种令人满意的方法。NFS就是个无状态系统。回呼(Callback)系统 在这种方法中,服务器记录它的那些客户机的所作所为,并保留它们正在缓存的文件信息。服务器在一个客户机改变了一个文件时使用一种叫回叫应答(callbackpromise)的技术通知其它客户机。这种方法减少了大量网络通信。AFS(及OSFDCE的DFS)就是回叫系统。客户机改变文件时,持有这些文件拷贝的其它客户机就被回叫并通知这些改变。无状态操作在运行性能上有其长处,但AFS通过保证不会被回叫应答充斥也达到了这一点。方法是在一定时间后取消回叫。客户机检查回叫应答中的时间期限以保证回叫应答是当前有效的。回叫应答的另一个有趣的特征是向用户保证了文件的当前有效性。换句话说,若一个被缓存的文件有一个回叫应答,则客户机就认为文件是当前有效的,除非服务器呼叫指出服务器上的该文件已改变了。 Yonghong Z-Data MartYonghong Data Mart是一款数据存储、数据处理的软件。Yonghong Data Mart采用基于ZDFS的分布式列存储系统,就是将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。Yonghong Data Mart的分布式文件存储系统 (ZDFS)是在Hadoop HDFS基础上进行的改造和扩展,将服务器集群内所有节点上存储的文件统一管理和存储。这些节点包括唯一的一个NamingNode,在 ZDFS 内部提供元数据服务;许多MapNode,提供存储块。存储在 ZDFS 中的文件被分成块,然后将这些块复制到多个计算机中(Map Node)。这与传统的 RAID 架构大不相同。块的大小和复制的块数量在创建文件时由客户机决定。Naming Node监控存在服务器集群内所有节点上的文件操作,例如文件创建、删除、移动、重命名等等。Network File System
文章TAG:分布分布式文件文件系统分布式文件系统

最近更新

  • 四川电信大数据资料四川电信大数据资料

    可以根据说明申请话费余额;四川省电信与成都有什么区别电信?请问,四川省查电信怎么查余额?宽宽通是四川电信的权威宽带服务。是电信最好的测速工具,是电信最方便快捷的缴费充值利器,每天更新.....

    知识 日期:2024-12-09

  • otg数据线受损,otg数据线卡sdsd受损怎么办?otg数据线受损,otg数据线卡sdsd受损怎么办?

    我今天收到了OTG的数据线,sd卡损坏了。我也遇到过这种情况,就关一次手机,高速传输otg数据线安卓手机电脑平板u盘鼠标线对手机有什么损伤...放心,没什么效果,正常使用就好,otg功能总是显示意.....

    知识 日期:2024-12-09

  • 835,835是什么金835,835是什么金

    835是什么金只有875是治疗指环2,处理器835是什么意思骁龙新处理器但是骁龙就是飙分数厉害实际使用很烂人的大脑。电脑的cou是电脑控制中心。高通最新高端处理器,安卓阵营数一数二的cpu3,.....

    知识 日期:2024-12-08

  • 紫光云数,对于广大用户来说紫光云的数据安全值得信赖吗紫光云数,对于广大用户来说紫光云的数据安全值得信赖吗

    对于广大用户来说紫光云的数据安全值得信赖吗在数据安全方面,是完全不用担心的,紫光云作为紫光集团“芯云战略”的重要组成部分,在血液里便流淌着“守护信息安全”的基因。从芯端到云端,打.....

    知识 日期:2024-12-08

  • 四次工业革命,人类经历了四次工业革命其标志分别是和的出现四次工业革命,人类经历了四次工业革命其标志分别是和的出现

    人类经历了四次工业革命其标志分别是和的出现2,历史上四大工业革命是什么1纺织2蒸汽机3,迄今为止共有几次工业革命分别是什麽4,四次工业革命专家或高手答20分5,人类经历哪四次工业革命6,什.....

    知识 日期:2024-12-08

  • 富士康的老板是谁,富士康的总裁是谁富士康的老板是谁,富士康的总裁是谁

    富士康的总裁是谁郭台铭、2,深圳富士康科技集团公司总裁叫什么名字深圳富士康没总裁,富士康母公司鸿海精密工业集团总裁郭台铭深圳只是其中一个基地,没有总负责人3,深圳富士康老板叫什么名.....

    知识 日期:2024-12-08

  • 智能天窗,普通天窗与智能双层电动天窗有什么区别智能天窗,普通天窗与智能双层电动天窗有什么区别

    普通天窗与智能双层电动天窗有什么区别一个是高科技,一个不是2,什么是智能双层电动天窗就是装了传感器的,下雨时会自动关上,温度低时也自动关上,双层就是有一层透明,另一层太阳膜带隔热3,什么.....

    知识 日期:2024-12-08

  • 和他的机器人,机器人和人类会产生感情吗?和他的机器人,机器人和人类会产生感情吗?

    我和机器人的故事写一篇500字的作文我和机器人的故事不久前,我遇到了一个非常特别的机器人,名叫ChatAi。人类会和机器人有感情吗?智能机器人已经被人类广泛使用,作为最好的生产工具和最忠.....

    知识 日期:2024-12-08