Đề Thi Ôn Luyện Big Data Mở Rộng - Đại Học Bách Khoa Hà Nội Miễn Phí, Có Đáp Án

Bạn đang tìm kiếm đề thi ôn luyện Big Data mở rộng từ Đại Học Bách Khoa Hà Nội? Tại đây, chúng tôi cung cấp tài liệu ôn tập chuyên sâu và đề thi Big Data mở rộng với đầy đủ đáp án chi tiết, hoàn toàn miễn phí. Bộ tài liệu giúp sinh viên nắm vững kiến thức từ cơ bản đến nâng cao về Big Data, từ xử lý dữ liệu lớn, phân tích dữ liệu đến các thuật toán phức tạp. Đây là tài liệu lý tưởng để ôn luyện và làm quen với cấu trúc đề thi mở rộng. Phù hợp cho sinh viên ngành Công nghệ Thông tin và những người muốn nâng cao kiến thức về Big Data. Tải ngay để chuẩn bị tốt nhất cho kỳ thi sắp tới.

Từ khoá: đề thi Big Data mở rộngôn luyện Big Data mở rộngtài liệu Big Data Đại Học Bách Khoađề thi Big Data có đáp ántài liệu ôn tập Big Data miễn phíBig Data mở rộng Bách Khoahọc Big Data mở rộngôn thi Big Data mở rộng Bách Khoaxử lý dữ liệu lớn mở rộngđề thi Big Data mở rộng kèm đáp án

Số câu hỏi: 26 câuSố mã đề: 1 đềThời gian: 1 giờ

92,220 lượt xem 7,090 lượt làm bài

Bạn chưa làm đề thi này!!!

Xem trước nội dung:

Câu 1: 1 điểm

Trong hệ sinh thái của Spark không có công cụ hay thành phần nào sau đây:

MLib

GraphX

Sqoop

Cluster Managers

Câu 2: 1 điểm

Spark Streaming trừu tượng hóa cũng như thao tác với các dòng dữ liệu (data stream) dựa trên khái niệm nào:

shared variable

RDD

DStream

DataFrame

Câu 3: 1 điểm

Spark hỗ trợ các cluster manager nào

Standalone Cluster manager

MESOS

YARN

tất cả đáp án trên

Câu 4: 1 điểm

Đáp án nào không phải là một “output operation ” khi thao tác với DStream

saveAsTextFile

foreachRDD

saveasHadoopFile

reduceByKeyAndWindow

Câu 5: 1 điểm

Đáp án nào không phải là một “Transformation” khi thao tác với DStream

reduceByWindow

window

foreachWindow

countByWindow

Câu 6: 1 điểm

Mục đích của sử dụng sparkML là gì ?

chạy MapReduce

chạy các thuật toán dự đoán

tính toán phân toán

cả b và c

Câu 7: 1 điểm

dữ liệu đầu vào được gán là feature và dự đoán được gán vào label

dữ liệu đầu vào được gán là label và kết quả của dữ liệu đầu vào đó được gán vào feature

dữ liệu đầu vào được gán là feature và kết quả của dữ liệu đầu vào được gán

vào label

dữ liệu đầu vào được gán là label và kết quả dự đoán được gán vào feature

Câu 8: 1 điểm

Đâu là lệnh lưu trữ dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile(‘file:///usr/momoinu/mon_loz/hihi.txt’)

input.saveAsTextFile(‘/usr/momoinu/mon_loz/hihi.txt’)

input.saveAs (‘file:///usr/momoinu/mon_loz/hihi.txt’)

input.saveAsTextFile: ‘file:///usr/momoinu/mon_loz/hihi.txt’

Câu 9: 1 điểm

Đâu là cách submit đúng 1 job lên Spark cluster hoặc chế độ local

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

phương án a và c

Câu 10: 1 điểm

Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào

delimiter nào : input.flatMap( lambda x: x.split(“\t”) ).map(lambda x: (x, 1)).reduceByKey(add)

Tab

Dấu cách

Dấu hai chấm

Dấu phẩy

Câu 11: 1 điểm

Cơ chế chịu lỗi của datanode trong HDFS

dử dụng ZooKeeper để quản lý các thành viên datanode trong cụm

sử dụng cơ chế heartbeat, định kỳ các datanode thông báo về trạng thái cho Namenode

sử dụng cơ chế heartbeat, Namenode định kỳ hỏi các datanode về trạng thái tồn tại của datanode

Câu 12: 1 điểm

Cơ chế tổ chức dữ liệu của Datanode trong HDFS

các chunk là các tệp tin trong hệ thống tệp tin cục bộ của máy chủ datanode

các chunk là các vùng dữ liệu liên tục trên ổ cứng của máy chủ data node

các chunk được lưu trữ tin cậy trên datanode theo cơ chế RAID

Câu 13: 1 điểm

Bản chất DStream:

là một chuỗi liên tục RDD

Là một chuỗi liên tục DataFrame

Là một chuỗi liên tục DataSet

ko có đáp án đúng

Câu 14: 1 điểm

Đầu vào dữ liệu cho chương trình Spark có thể là:

Local file

HDFS, NFS

Amazon S3, Elasticsearch

Cả 3 phương án trên

Câu 15: 1 điểm

Đâu là lệnh lưu dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile('/usr/zeppelin/notebook/dataset/new.txt')

input.saveAs('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile:'file:///usr/zeppelin/notebook/dataset/new.txt'

Câu 16: 1 điểm

Đâu là cách submit đúng một job lên Spark cluster hoặc chế độ local:

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

Phương án A và C

Câu 17: 1 điểmchọn nhiều đáp án

Data Pipeline nào sau đây là đúng trên Spark

Spark -> RabbitMQ -> Elasticsearch -> Hiển thị

Dữ liệu sensor -> RabbitMQ -> Elasticsearch -> Spark ->Hiển thị

Dữ liệu sensor -> Elasticserach -> RabbitMQ -> Spark ->Hiển thị

Spark -> Elasticsearch ->Hiển thị (đ biết có đúng ko)

Câu 18: 1 điểm

Mục đích của sử dụng RabbitMQ là gì?

Lưu trữ dữ liệu

Tránh dữ liệu bị mất mát

Hiển thị dữ liệu

Phân tích dữ liệu

Câu 19: 1 điểm

Spark có thể chạy ở chế độ nào khi chạy trên nhiều máy?

Chạy trên YARN

Chạy trên ZooKeeper

Phương án A và B đều sai

Cả 2 phương án A và B

Câu 20: 1 điểm

Mục đích của sử dụng Spark ML là gì?

Chạy MapReduce

Chạy các thuật toán dự đoán

Tính toán phân tán

Cả B and C

Câu 21: 1 điểm

Cái nào trong số này cung cấp hệ thống xử lý Luồng được sử dụng trong hệ

sinh thái Hadoop?

Solr

Tez

Spark

D – Hive

Câu 22: 1 điểm

Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

Pseudo distributed mode

Globally distributed mode

Stand alone mode

Fully-Distributed mode

Câu 23: 1 điểm

Chọn phát biểu đúng khi nói về MongoDB

MongoDB có các trình điều khiển driver cho nhiều ngôn ngữ lập trình khác nhau.

các văn bản có thể chứa nhiều cặp key-value hoặc key-array, hoặc các văn bản lồng (nested documents)

tất cả các phương án trên

MongoDB hay các NoSQL có khả năng khả mở tốt hơn các CSDL quan hệ truyền thống

Câu 24: 1 điểm

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:

Scheduler

Balancer

Spreader

Reporter

Câu 25: 1 điểm

Thuộc tính được sử dụng để đặt hệ thống tệp mặc định cho Hadoop trong

core-site.xml là

filesystem.default

fs.default

fs.defaultFS

hdfs.default

Câu 26: 1 điểm

Tùy chọn nào trong số này không phải là tùy chọn lập lịch có sẵn với YARN?

Optimal Scheduler

FIFO scheduler

Capacity scheduler

Fair scheduler

Đề thi tương tự

Đề thi ôn luyện Trắc nghiệm Lịch Sử Đảng - Học viện Nông nghiệp Việt NamLịch sử

7 mã đề 322 câu hỏi 1 giờ

24,0171,836

Đề Thi Ôn Luyện Mạng Máy Tính - Tầng Liên Kết Dữ Liệu Và Tầng Vật Lý - An Toàn Và Bảo Mật Mạng Học Viện Công Nghệ Bưu Chính Viễn ThôngĐại học - Cao đẳngCông nghệ thông tin

1 mã đề 54 câu hỏi 1 giờ

60,6124,657

Đề Thi Ôn Luyện Lý Thuyết Kiểm Toán - Đại Học Điện Lực (Miễn Phí, Có Đáp Án)Đại học - Cao đẳng

1 mã đề 40 câu hỏi 1 giờ

19,6661,495

Đề Thi Ôn Luyện Lịch Sử Đảng - Đại Học Vinh (Miễn Phí, Có Đáp Án)Đại học - Cao đẳngLịch sử

2 mã đề 80 câu hỏi 1 giờ

43,9403,393

Đề thi Ôn luyện môn Cơ sở dữ liệu SQL HUBT có đáp ánĐại học - Cao đẳngCông nghệ thông tin

3 mã đề 141 câu hỏi 1 giờ

143,80111,052

Đề Thi Ôn Luyện Triết Học Mác - Lênin (Miễn Phí, Có Đáp Án)Đại học - Cao đẳngTriết học

2 mã đề 84 câu hỏi 1 giờ

35,5882,737

Đề Thi Ôn Luyện Kinh Tế Vĩ Mô Chương 2 - Phần 2 Miễn Phí, Có Đáp ÁnĐại học - Cao đẳng

1 mã đề 48 câu hỏi 1 giờ

90,2326,937

Đề Thi Ôn Luyện Môn Sản 1 VMU - Đại Học Y Khoa Vinh Miễn Phí, Đáp Án Chi TiếtĐại học - Cao đẳng

2 mã đề 78 câu hỏi 1 giờ

12,448953

Đề Thi Ôn Luyện Môn Kháng Sinh HPMU Đại Học Y Dược Hải Phòng - Miễn Phí Có Đáp ÁnĐại học - Cao đẳng

2 mã đề 99 câu hỏi 1 giờ

71,8815,525

LetQA - Ôn luyện đề thi trắc nghiệm online miễn phí

Về chúng tôi

LetQA là công cụ hỗ trợ học sinh, sinh viên, giáo viên, tổ chức trong việc ôn luyện, kiểm tra kiến thức online; website được cung cấp miễn phí cho tất cả người dùng.
LetQA KHÔNG cung cấp dịch vụ mạng xã hội, không cung cấp thông tin tổng hợp và không thu phí người dùng.

Thông tin liên hệ & hỗ trợ

Email: hotro@letqa.com

Facebook: LetQA (fb.com/letqavn)

Liên kết phổ biến

Nhóm học tập trao đổi

Yêu cầu bổ sung đề thi

Đóng góp đề thi

Website liên kết

Phần mềm kiểm tra trùng lặp đạo văn Kiểm Tra Tài Liệu

Phần mềm xuất bản tạp chí điện tử VOJS

Công cụ kiểm tra chính tả và thể thức Viver

Công cụ hỗ trợ trích dẫn và phân tích khoa học Scholar Hub