1. कौन सा डेटा साइंस लाइफ साइकिल के चरण 1 से नहीं है
लक्ष्य डोमेन सीखना
प्रारंभिक परिकल्पना का विकास करना
प्रारंभिक परिकल्पना की कल्पना करें
प्रमुख चर की पहचान करना
उत्तर: प्रारंभिक परिकल्पना की कल्पना करें
2. डेटा साइंस के लिए निम्न में से कौन सी भाषा सबसे महत्वपूर्ण है?
माणिक
आर
जावा
कोई भी नहीं
उत्तर: आर
3. संबंधित विषय के बारे में जानकारी के संग्रह को __________ कहा जाता है
VISUALIZATION
विश्लेषण
निष्कर्ष
आंकड़े
उत्तर: विज़ुअलाइज़ेशन
4. _________ को खोजने के लिए आप सभी संख्याओं को जोड़ते हैं और फिर आपके पास कितनी संख्याओं से भाग देते हैं।
मंझला
अर्थ
तरीका
श्रेणी
उत्तर: मतलब
5. निम्नलिखित में से कौन सा डाटा साइंटिस्ट द्वारा किया जाता है?
प्रतिलिपि प्रस्तुत करने योग्य कोड बनाएँ
चुनौती के परिणाम
प्रश्न को परिभाषित कीजिए
ऊपर के सभी
उत्तर: चुनौती परिणाम
6. सांख्यिकीय डेटा विश्लेषण के लिए कौन सा उपकरण नहीं है?
रसद प्रतिगमन
रैखिक और गैर-रैखिक प्रतिगमन
हिस्टोग्राम
एनोवा
उत्तर: हिस्टोग्राम
7. टेस्ट स्कोर का औसत क्या है?{70, 70, 80, 85, 85, 90, 95, 95, 100, 100}
85, 95 और 100
30
87
कोई भी नहीं
उत्तर : 87
8. इस परिभाषा के लिए सही कीवर्ड चुनें: डेटा सेट का ग्राफिकल प्रतिनिधित्व
डेटा सेट
खोजी चक्र
VISUALIZATION
कोई भी नहीं
उत्तर: विज़ुअलाइज़ेशन
9. ________ ज्ञात करने के लिए आप सभी संख्याओं को सबसे छोटे से सबसे बड़े क्रम में लगाएं और बीच में आने वाली संख्या ज्ञात करें।
मंझला
तरीका
अर्थ
श्रेणी
उत्तर: माध्यिका
10. R एक व्याख्या की गई भाषा है इसलिए यह _____________ के माध्यम से एक्सेस कर सकती है?
कमांड लाइन दुभाषिया
डिस्क ऑपरेटिंग सिस्टम
ऑपरेटिंग सिस्टम
यूजर इंटरफेस ऑपरेटिंग सिस्टम
उत्तर: कमांड लाइन दुभाषिया
1 1। बैंक की वेबसाइट पर आगंतुकों की देखने की आदतों पर डेटा एकत्र किया गया है। वेबसाइट पर एक ही विज़िट के दौरान सामान्यतः देखे जाने वाले पृष्ठों की पहचान करने के लिए किस तकनीक का उपयोग किया जाता है?
क्लस्टरिंग
वर्गीकरण
एसोसिएशन नियम
वापसी
उत्तर: संघ नियम
12. दो या दो से अधिक चरों के बीच संबंध को ________ के रूप में संदर्भित किया जाता है
रुझान
नोकदार चीज़
ऊपर के सभी
इनमें से कोई भी नहीं
उत्तर: प्रवृत्ति
13. डेटा सेट के ग्राफिकल प्रतिनिधित्व को ______ के रूप में जाना जाता है।
VISUALIZATION
डेटा सेट
खोजी चक्र
कोई भी नहीं
उत्तर: विज़ुअलाइज़ेशन
14. डेटा प्राप्त करने के बाद डेटा वैज्ञानिक द्वारा निम्न में से कौन सा कदम किया जाता है?
डेटा एकीकरण
डेटा प्रतिकृति
डेटा सफाई
ऊपर के सभी
उत्तर: डेटा क्लींजिंग
15. ट्रेंड के बाहर मौजूद डेटा को ______ कहा जाता है।
ग़ैर
रुझान
नोकदार चीज़
1 और 2 दोनों
उत्तर: 1 और 2 दोनों
Data Science MCQ (Multiple Choice Questions)
1. Which one is NOT from Phase 1 of Data Science Life Cycle
Learning the target domain
Developing initial hypothesis
Visualize initial hypothesis
Identifying key variables
Answer: Visualize initial hypothesis
2. Which of the following is the most important language for Data Science?
Ruby
R
Java
None
Answer: R
3. A collection of information about a related topic is referred to as a__________
Visualisation
Analysis
Conclusion
Data
Answer: Visualisation
4. To find the _________ you add up all the numbers and then divide by how many numbers you have.
Median
Mean
Mode
Range
Answer: Mean
5. Which of the following is performed by Data Scientist ?
Create reproducible code
Challenge results
Define the question
All of the above
Answer: Challenge results
6. Which is not a tool for Statistical Data Analysis?
Logistic Regression
Linear & Non-linear Regression
Histogram
ANOVA
Answer: Histogram
7. What is the mean of test scores?{70, 70, 80, 85, 85, 90, 95, 95, 100, 100}
85, 95, and 100
30
87
None
Answer: 87
8. Choose the correct keyword for this definition: A graphical representation of a data set
Data Set
Investigative Cycle
Visualisation
None
Answer: Visualisation
9. To find the ________ you put all numbers in order from least to greatest and find the number that is in the middle.
Median
Mode
Mean
Range
Answer: Median
10. R is an interpreted language so it can access through _____________?
Command line interpreter
Disk operating system
Operating system
User interface operating system
Answer: Command line interpreter
11. Data has been collected on visitors’ viewing habits at a bank’s website. Which technique is used to identify pages commonly viewed during the same visit to the website?
Clustering
Classification
Association Rules
Regression
Answer: Association Rules
12. A relationship between two or more variables is referred to as a ________
Trend
Spike
All of above
None of above
Answer: Trend
13. A graphical representation of a data set is referred to as a ______
Visualization
Data Set
Investigative Cycle
None
Answer: Visualization
14. Which of the following step is performed by data scientist AFTER acquiring the data?
Data Integration
Data Replication
Data Cleansing
All of the above
Answer: Data Cleansing
15. Data that sits outside the trend is referred to as a ______
Outlier
Trend
Spike
Both 1 & 2
Answer: Both 1 & 2
16. Which of the following approach should be used to ask Data Analysis question?
Find out the question which is to be answered
Find only one solution for particular problem
Find out answer from dataset without asking question
None
Answer: Find out the question which is to be answered
17. Which of the following is NOT a machine learning algorithm?
SVG
Random Forest
SVM
None
Answer: SVG
18. What is Big Data?
Data with the word ‘big’ in it
Data about people who are big
Data with a large size
Data made with a big purpose
Answer: Data with a large size
19. What is R an implementation of?
Logical Scoping
S Programming Language
Lexical Scoping
Q Programming Language
Answer: S Programming Language
20. The 5 steps required to identify a problem and come up with a solution are referred to as the ________ Cycle
Visualization
Investigative
Conclusion
None
Answer: Investigative
21. Which of the following is characteristic of Processed Data?
Hard to use for data analysis
Data is not ready for analysis
All steps should be noted
None of the above
Answer: None of the above
22. Which was not mentioned as a latest trend tool________
Excel
Pentaho
SPSS
Notepad
Answer: Notepad
23. Which of the following is one of the key data science skill ?
Machine Learning
Statistics
Data Visualization
All of the above
Answer: All of the above
24. Which of the following is not a stage in the Investigative Cycle?
Investigate
Analysis
Conclusion
None
Answer: Investigate
25. Vectors come in two parts_____ and _____
Atomic vectors and list
Atomic vectors and array
Atomic vectors and matrix
None
Answer: Atomic vectors and list
26.Choose the correct keyword for this definition: A collection of information about a related topic
Trend
Spike
Data Set
None
Answer: Data Set
27. The process of evaluating data through analytical and statistical tools.
Data Mining
Data Exploration
Data Analysis
Data Visualization
Answer: Data Analysis
28. Which of the following is key characteristic of hacker ?
Willing to find answers on their own
Afraid to say they don’t know the answer
Not Willing to find answers on their own
All of the mentioned
Answer: Willing to find answers on their own
29. Which of the following characteristic of big data is relatively more concerned to data science ?
Variety
Volume
Velocity
None
Answer: Variety
30. R is an__________ programming language?
GPL
Open source
Closed source
Definite source
Answer: Open source
✹•⁘••⁘•✹•⁘••⁘•⁘••⁘•✹•⁘••⁘•✹