Hacker News

अपाचे एरो 10 साल के बा

अपाचे एरो 10 साल के बा अपाचे के ई व्यापक बिस्लेषण एकरे मूल घटक सभ के बिस्तार से जांच आ व्यापक निहितार्थ सभ के पेशकश करे ला। फोकस के प्रमुख क्षेत्र बा चर्चा के केंद्र में बा: कोर तंत्र आ प्रक्रिया के बारे में बतावल गइल बा ...

1 min read Via arrow.apache.org

Mewayz Team

Editorial Team

Hacker News
| कॉलम मेमोरी फॉर्मेट स्पेसिफिकेशन के रूप में अपना विनम्र उत्पत्ति से, एरो आधुनिक डेटा स्टैक के सभसे बुनियादी परत सभ में से एक में बढ़ गइल बा, चुपचाप अइसन टूल सभ के पावर दे रहल बा जिनहन पर लाखन डेवलपर आ एनालिस्ट लोग रोज भरोसा करे ला।

अपाचे तीर ठीक से का ह आ पहिला दिन से एकर महत्व काहे रहे?

अपाचे एरो के जनम एगो साधारण लेकिन गहिराह कुंठा से भइल रहे: हर डेटा टूल एगो अलग आंतरिक भाषा बोलत रहे। पंडा के आपन मेमोरी लेआउट रहे। स्पार्क के एगो अउरी रहे। आर के एगो अउरी रहे। हर बेर जब डेटा सिस्टम सभ के बीच चले ला तब एकरा के सीरियलाइज, डिसीरियलाइज आ रिफॉर्मेट करे के पड़े ला — ई प्रक्रिया सीपीयू चक्र सभ के बर्न करे, मेमोरी के खपत करे आ पाइपलाइन सभ में लेटेंसी जोड़े लीं जेकरा के टीम सभ के तेज होखे के जरूरत होखे।

तीर के प्रस्ताव सुरुचिपूर्ण रहल: एकही, मानकीकृत कॉलम मेमोरी फॉर्मेट के परिभाषित कइल जाय जेकरा के कौनों भी भाषा भा रनटाइम बिना कॉपी भा कन्वर्ट कइले पढ़ सके। जब पायथन स्क्रिप्ट एरो के माध्यम से डेटा के रस्ट लाइब्रेरी के सौंप देवेले त कवनो रूपांतरण ना होखेला। पन्ना पर बिट एके जइसन बा. ई जीरो-कॉपी इंटरऑपरेबिलिटी वास्तव में ओह दुनिया में क्रांतिकारी रहल जहाँ डेटा इंजीनियरिंग तेजी से पॉलीग्लोट हो रहल रहे।

अपना पहिला साल में, एरो पांडास, ड्रेमियो, वेस मैककिनी, आ प्रमुख क्लाउड इंफ्रास्ट्रक्चर खिलाड़ी लोग के पीछे के टीम सभ के योगदान आकर्षित कइलस। ई तथ्य कि ई 2016 में अपाचे इनक्यूबेशन से एतना बिसाल इंडस्ट्री बैकिंग के साथ ग्रेजुएशन कइलस, ई संकेत दिहलस कि डेटा समुदाय ई पहिचान लिहलस कि ई खाली एगो अउरी फॉर्मेट ना हवे — ई बुनियादी ढांचा स्तर पर एगो सिस्टमिक समस्या के हल करे के कोसिस रहल।

पिछला एक दशक में अपाचे तीर के विकास कईसे भईल बा?

दस साल में, एरो मेमोरी फॉर्मेट से कहीं अधिका बा। ई प्रोजेक्ट संबंधित बिसेसता आ कार्यान्वयन सभ के समृद्ध इकोसिस्टम में बिस्तार लिहले बा:

    के बा
  • तीर उड़ान: gRPC पर बनल एगो हाई-परफॉर्मेंस डेटा ट्रांसपोर्ट प्रोटोकॉल, जे एरो डेटा के बिना सीरियलाइजेशन ओवरहेड के तार गति से सेवा सभ के बीच चले में सक्षम बनावे ला।
  • एरो फ्लाइट एसक्यूएल: एगो एक्सटेंशन जे डेटाबेस सभ के एरो फ्लाइट के इस्तेमाल से SQL इंटरफेस सभ के उजागर करे के इजाजत देला, परंपरागत क्वेरी-रिजल्ट-फेच चक्र के एकही कुशल स्ट्रीम में ढह देला।
  • अपाचे एरो डाटाफ्यूजन: एगो रस्ट-नेटिव क्वेरी इंजन हवे जे एरो के इस्तेमाल अपना नेटिव मेमोरी फॉर्मेट के रूप में करे ला, बिना अलग डेटाबेस प्रक्रिया के एम्बेडेड एनालिटिक्स के सक्षम करे ला।
  • एडीबीसी (एरो डेटाबेस कनेक्टिविटी): एगो डेटाबेस कनेक्टिविटी एपीआई जे ओडीबीसी आ जेडीबीसी के मॉडल पर बनल बा बाकी एरो-नेटिव, जे एप्लीकेशन सभ के डेटाबेस से क्वेरी करे आ सीधे एरो फॉर्मेट में रिजल्ट पावे के इजाजत देला।
  • तीर आईपीसी प्रारूप: एगो फाइल आ स्ट्रीमिंग प्रारूप हवे जेह में तीर डेटा के प्रक्रिया आ मशीन सभ में एकही जीरो-कॉपी दक्षता के साथ लगातार आ आदान-प्रदान कइल जा सके ला।
के बा

13 गो आधिकारिक भाषा के कार्यान्वयन सभ में — जेह में C++, जावा, गो, रस्ट, पायथन, जावास्क्रिप्ट, C#, आ अउरी कई गो सामिल बाड़ें — एरो ओह तरह के क्रॉस-इकोसिस्टम अपनावे के हासिल कइले बा जेकर बारे में ज्यादातर ओपन-सोर्स प्रोजेक्ट सभ खाली सपना देखे लें। पोलर्स, डकडीबी, आ इन्फ्लक्सडीबी 3.0 नियर लाइब्रेरी सभ आपन पूरा इंजन एरो कॉलम फॉर्मेट के आसपास बनवले बाड़ी सऽ, एकरा के इंटरऑपरेबिलिटी लेयर के रूप में ना बलुक अपना कोर डेटा रिप्रेजेंटेसन के रूप में मानत बाड़ी सऽ।

डेटा से संचालित बिजनेस पर एरो के कवन वास्तविक दुनिया के प्रभाव पड़ल बा?

<ब्लॉककोट> के बा

"अपाचे एरो खाली डेटा के गति तेज ना कइलस — ई फिर से परिभाषित कइलस कि बिजनेस प्लेटफार्म के डेटा लेयर कइसन हो सके ला। जब इंफ्रास्ट्रक्चर मानक में गायब हो जाला तब बिल्डर लोग मूल्य पर फोकस क सके ला।"

के बा

तीर के बिजनेस इम्पैक्ट दू गो क्षेत्र में सभसे ढेर लउके ला: लागत में कमी आ पुनरावृत्ति के गति। कबो क्रॉस-सिस्टम डेटा मूवमेंट खातिर पाइपलाइन लेटेंसी के घंटन के बजट बनावे वाली टीम अब मिलीसेकेंड में नापल जालीं। एनालिटिक्स जवना में डेडिकेटेड डाटा वेयरहाउस क्लस्टर के जरूरत रहे, अब डाटाफ्यूजन भा डकडीबी के इस्तेमाल से एप्लीकेशन सर्वर में एम्बेडेड हो सकेला। परिचालन लागत में कमी नापे जोग बा — आ पैमाना पर संचालित बिजनेस सभ खातिर ई महत्वपूर्ण बा।

मेवेज जइसन आधुनिक बिजनेस ऑपरेटिंग सिस्टम खातिर, जवन सीआरएम, मार्केटिंग, ई-कॉमर्स, शेड्यूलिंग, आ एनालिटिक्स के 207 गो मॉड्यूल के एकही प्लेटफार्म में एकीकृत करेला, एरो के आर्किटेक्चरल पाठ गहिराह प्रासंगिक बा। मानकीकृत आंतरिक डेटा प्रतिनिधित्व, सेवा सभ के बीच कुशल आवाजाही, आ मॉड्यूल सभ के बीच जीरो-कॉपी साझा कइल ठीक इंजीनियरिंग गुण हवें जे 207 मॉड्यूल वाला सिस्टम के बेस्पोक इंटीग्रेशन सभ के उलझल गंदगी बनले बिना सुसंगत आ तेज रहे के इजाजत देलें।

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

तीर के आर्किटेक्चर के तुलना पारंपरिक डेटा आदान-प्रदान के तरीका से कईसे होला?

तीर से पहिले, प्रमुख इंटरचेंज फॉर्मेट पंक्ति-उन्मुख रहे: CSV, JSON, आ रिलेशनल रो स्टोर। ई प्रारूप सभ पठनीय आ लचीला होलें बाकी लाखन पंक्ति सभ में कॉलम सभ के स्कैन करे वाला बिस्लेषणात्मक वर्कलोड सभ खातिर गहिराह अकुशल होलें। CSV से एकही कॉलम पढ़े के मतलब होला हर पंक्ति के पार्स कइल। एरो टेबल से कॉलम पढ़े के मतलब होला एकही सटल मेमोरी स्कैन — एगो अइसन ऑपरेशन जे सीपीयू कैश लाइन सभ के संतृप्त करे ला आ सिमड वेक्टराइजेशन से फायदा उठावे ला।

एरो के सबसे करीबी चचेरा भाई पार्केट के तुलना में, प्रमुख अंतर इन-मेमोरी बनाम ऑन-डिस्क ऑप्टिमाइजेशन बा। लकड़ी के छत के बहुत संकुचित आ भंडारण आ क्रमिक रीड खातिर अनुकूलित कइल गइल बा। तीर सक्रिय गणना खातिर अनुकूलित बा — ई ऊ फॉर्मेट हवे जेकर इस्तेमाल रउआँ तब करे लीं जब डेटा जिंदा होखे आ प्रोसेस होखे, ना कि जब ई डिस्क पर टिकल होखे। ब्यवहार में आधुनिक डेटा सिस्टम सभ में दुनों के इस्तेमाल होला: भंडारण खातिर लकड़ी के छत, गणना खातिर तीर, इनहन के बीच कुशल रूपांतरण के साथ।

बिजनेस सॉफ्टवेयर आर्किटेक्ट लोग खातिर सीख ई बा कि फॉर्मेट के चुनाव कवनो तटस्थ फैसला ना होला। पंक्ति-उन्मुख भंडारण लेनदेन के लिखे के तेजी से बनावेला। कॉलम इन-मेमोरी रिप्रेजेंटेसन से एनालिटिकल रीड तेज हो जाला। परिपक्व प्लेटफार्म दुनों के संभाले ला, सही समय पर सही प्रतिनिधित्व के माध्यम से डेटा के रूटिंग करे ला — ठीक ओह तरह के अदृश्य इंफ्रास्ट्रक्चर जे स्केल करे वाला प्लेटफार्म आ ना करे वाला प्लेटफार्म के बीच अंतर पैदा करे ला।

अपाचे एरो खातिर अगिला दशक कइसन लउकी?

तीर के प्रक्षेपवक्र गहिराह एम्बेडिंग आ व्यापक मानकीकरण के ओर इशारा करेला। जइसे-जइसे एआई आ मशीन लर्निंग के वर्कलोड बिजनेस ऑपरेशन में केंद्रीय हो जाला, एरो के कॉलम फॉर्मेट एमएल फ्रेमवर्क में इस्तेमाल होखे वाला टेंसर रिप्रेजेंटेसन के साथ स्वाभाविक रूप से संरेखित होला। प्रोजेक्ट सभ पहिले से ही एरो के टेबुलर बिजनेस डेटा आ टेंसर-नेटिव एमएल पाइपलाइन सभ के बीच सेतु के रूप में खोज कर रहल बाड़ी सऽ, जेकरा से ट्रांसफॉर्मेशन ओवरहेड कम हो गइल बा जे वर्तमान में एआई फीचर पाइपलाइन सभ के धीमा क देला।

एडीबीसी पहल अइसन भविष्य के सुझाव देले जहाँ एप्लीकेशन कोड कवनो डेटाबेस से पूछताछ करे आ परिणाम सार्वभौमिक रूप से उपभोग्य प्रारूप में पावे, बिना ड्राइवर-विशिष्ट विचित्रता भा सीरियलाइजेशन टैक्स के। हजारन ग्राहकन में बिबिध डेटा स्रोत सभ के प्रबंधन करे वाला सास प्लेटफार्म सभ खातिर, कनेक्टिविटी लेयर पर एह तरह के मानकीकरण ओतने बुनियादी बा जेतना कि एचटीटीपी वेब सेवा सभ खातिर रहल।

अक्सर पूछल जाए वाला सवाल

का अपाचे एरो डेटाबेस ह कि फाइल फॉर्मेट?

अपाचे एरो ना त डेटाबेस हवे आ ना कौनों साधारण फाइल फॉर्मेट — ई इन-मेमोरी कॉलम डेटा रिप्रेजेंटेसन खातिर स्पेसिफिकेशन हवे, एकरे साथ-साथ संबंधित प्रोटोकॉल आ टूल सभ के परिवार भी होला। एकरा के साझा भाषा के रूप में सोची कि अलग-अलग डेटाबेस, क्वेरी इंजन आ प्रोग्रामिंग भाषा सभ नेटिव रूप से बोल सके लीं, एह तरीका से अनुवाद के ओवरहेड खतम हो जाला जे आमतौर पर डेटा सिस्टम के सीमा के पार करे पर होला।

का अपाचे एरो लकड़ी के छत के जगह ले लेला?

ना — तीर आ लकड़ी के छत अलग-अलग समस्या के समाधान करेला आ एक साथ सबसे बढ़िया काम करेला। लकड़ी के लकड़ी के डिस्क पर संपीड़ित, कुशल भंडारण खातिर अनुकूलित कइल गइल बा आ ई डेटा झील सभ खातिर प्रमुख कॉलम फाइल फॉर्मेट हवे। एरो के बिना कॉपी कइले इन-मेमोरी कंप्यूटेशन आ क्रॉस-सिस्टम डेटा साझा करे खातिर अनुकूलित कइल गइल बा। आधुनिक डेटा सिस्टम सभ में आमतौर पर डेटा के पार्केट के रूप में स्टोर कइल जाला आ सक्रिय प्रोसेसिंग खातिर एरो फॉर्मेट में लोड कइल जाला।

अपाचे एरो बिजनेस सॉफ्टवेयर प्लेटफार्म खातिर कइसे प्रासंगिक बा?

इंटीग्रेटेड बिजनेस प्लेटफार्म सभ खातिर, एरो के आर्किटेक्चरल सिद्धांत — मानकीकृत आंतरिक डेटा रिप्रेजेंटेसन, घटक सभ के बीच जीरो-कॉपी शेयरिंग, आ कुशल बिस्लेषणात्मक पहुँच — सीधे प्रभावित करे लें कि मल्टी-मॉड्यूल सिस्टम बिना इंटीग्रेशन डेट जमा कइले केतना बढ़िया से स्केल क सके ला। एह सिद्धांत सभ के आंतरिक रूप देवे वाला प्लेटफार्म सभ आनुपातिक रूप से जटिलता जोड़ले बिना कामकाज जोड़ सके लें।

मेवेज में हमनी के 207 मॉड्यूल वाला बिजनेस ऑपरेटिंग सिस्टम बनवले बानी जा जवना के इस्तेमाल दुनिया भर में 138,000 से अधिका बिजनेस करेलें, जवना में सीआरएम आ ईमेल मार्केटिंग से ले के ई-कॉमर्स आ एनालिटिक्स तक के हर चीज के एके सुसंगत प्लेटफार्म में एकीकृत कइल गइल बा. डेटा इंफ्रास्ट्रक्चर के लेके एरो के तरीका निहन हमनी के मानना ​​बा कि महान बिजनेस सॉफ्टवेयर के जटिलता में अदृश्य होखे के चाही अवुरी मूल्य में स्पष्ट होखे के चाही। योजना महज $19/महीना से शुरू होला।

app.mewayz.com पर आपन मुफ्त परीक्षण शुरू करीं आ अनुभव करीं कि सही मायने में एकीकृत बिजनेस ओएस कइसन लागेला — ओही दर्शन पर बनल जवन अपाचे एरो के अनिवार्य बना दिहलस: बुनियादी ढांचा स्तर पर मेहनत करीं ताकि बिल्डर लोग जवन महत्व राखेला ओकरा पर ध्यान दे सके.