106
GB
What is the difference between schema-on-read and schema-on-write approaches in data modeling?
IN
डेटा मॉडलिंग में स्कीमा-ऑन-रीड और स्कीमा-ऑन-राइट दृष्टिकोण के बीच क्या अंतर है?
A
They are identical approaches used in different database types
वे विभिन्न डेटाबेस प्रकारों में उपयोग किए जाने वाले समान दृष्टिकोण हैं
B
Schema-on-read is always more efficient than schema-on-write
स्कीमा-ऑन-रीड हमेशा स्कीमा-ऑन-राइट की तुलना में अधिक कुशल होता है
C
Schema-on-write (traditional RDBMS): schema is defined and enforced before data is written; data must conform to schema at write time (strict, consistent but less flexible). Schema-on-read (Hadoop/data lake): raw data is stored without enforcing schema; schema is applied when data is read (flexible, accepts any data format)
स्कीमा-ऑन-राइट (पारंपरिक आरडीबीएमएस): डेटा लिखने से पहले स्कीमा को परिभाषित और लागू किया जाता है; डेटा को लिखने के समय स्कीमा के अनुरूप होना चाहिए (सख्त, सुसंगत लेकिन कम लचीला)। स्कीम-ऑन-रीड (Hadoop/डेटा लेक): स्कीमा लागू किए बिना कच्चा डेटा संग्रहीत किया जाता है; डेटा पढ़ते समय स्कीमा लागू किया जाता है (लचीला, किसी भी डेटा प्रारूप को स्वीकार करता है)
D
Schema-on-read is for SQL databases; schema-on-write is for NoSQL only
स्कीमा-ऑन-रीड SQL डेटाबेस के लिए है; स्कीमा-ऑन-राइट केवल NoSQL के लिए है
✅ Correct Answer:
💡 Explanation / व्याख्या
Explanation (English)
Schema-on-write: CREATE TABLE enforces structure, rejects invalid data at insert time. Schema-on-read: store any JSON/CSV/Parquet files in S3/HDFS; apply schema when querying (Hive external tables, Spark DataFrames). Benefits of SOR: accept data before knowing its structure, multiple schemas on same data. Drawback: data quality issues only discovered at query time.
व्याख्या (हिन्दी)
स्कीम-ऑन-राइट: CREATE TABLE संरचना को लागू करता है, सम्मिलित समय पर अमान्य डेटा को अस्वीकार करता है। स्कीम-ऑन-रीड: किसी भी JSON/CSV/Parquet फ़ाइलों को S3/HDFS में संग्रहीत करें; क्वेरी करते समय स्कीमा लागू करें (हाइव बाहरी तालिकाएँ, स्पार्क डेटाफ़्रेम)। एसओआर के लाभ: डेटा की संरचना जानने से पहले उसे स्वीकार करें, एक ही डेटा पर कई स्कीमा। दोष: डेटा गुणवत्ता संबंधी समस्याएं केवल क्वेरी के समय ही खोजी गईं।