Big Data Reviews

  • Big Data Analytics for beginners

    Big data analytics examines large amounts of data to uncover hidden patterns, correlations and other insights. With today's technology, it's possible to analyze your data and get answers from it almost immediately – an effort that's slower and less efficient with more traditional business intelligence solutions.
    84142 Views
  • ايه الفرق بين ال Big Data و ال Data Science و ال Data Analysis

    مساء الخير
    ازيكم

    زي ما وعدتكم المرة اللي فاتت ان شاء الله المرة دي حنتكلم عن الفروق بين مجالات مسمياتها قريبة قوي من بعض و اللي هي
    Big Data
    Data Analysis
    Data Science
    و حنحاول ندي نبذة عن كل واحد فيهم و ايه المهارات المختلفة اللي محتاج تعرفها علشان تبتدي في المجال ده.

    ايه هو ال Big Data؟
    يمكن في الفترة الأخيرة مصطلح ال Big Data كان عليه دوشة كثير بالذات لما عمرو أديب قال تعريف عجيب ليه أظهره كأنه حاجة شريرة أو سيئة, و طبعاً التعريف ده للأسف ما كانش ليه أي علاقة بالواقع.
    ال Big Data في النهاية هو مجال هندسي من مجالات هندسة البرمجيات, بيهدف في الأساس لبناء أنظمة تقدر تتعامل مع حجم البيانات الهائل, و لو أخدت بالك احنا هنا ما قلناش نوع التعامل ده ايه, احنا هنا بنتكلم في أساس أي تعامل مع البيانات و اللي بيبتدي عادة بالتخزين, و الأرشفة و البحث و القدرة على انك تعمل عمليات عليها. يعني علشان نقرب المفهوم, قاعدة البيانات اللي احنا كلنا متعودين عليها زي mySQL, PostgreSQL, SQL Server في النهاية بتخزن, و تفهرس و تتيح وسائل للتعامل مع البيانات نفسها, و ده نفس اللي بتعمله ال Big Data Systems برضه, لكن الفرق الأهم هو ان حجم البيانات ضخم جداً, و بالتالي البيانات دي مش متخزنة على سيرفر واحد مثلاً, بل ممكن تبقى عشرات بل مئات الآلاف من السيرفرات اللي كلها بتساهم في بناء نظام ال Big Data بتاعك.
    من أشهر أنظمة ال Big Data و اللي يمكن أغلب الناس اللي في المجال ده بتستخدمه, هو مجموعة تقنيات Apache Hadoop و زي ما أكيد أخدت بالك اني قلت مجموعة تقنيات, و ده لأنه Hadoop ده تقدر تقول كده انه مظلة لمجموعة كبيرة جداً من التقنيات اللي كل حاجة فيها بتعمل وظيفة معينة و بتساعدك في سيناريوهات معينة.
    يعني مثلاً, أول حاجة غالباً حتحتاجها في التعامل مع أي بيانات, هو انك تخزنها و تنظمها في حاجة زي ال File System اللي على جهازك, و هنا بيجي دور أول تقنية و هي HDFS و ده اسم ال File System بتاع Hadoop و اللي يعتبر القاعدة الأساسية اللي بتني عليها كل التقنيات التانية, و ده اللي بيسمح بتخزين البيانات و الحفاظ عليها عن طريق ال Redundancy و يديلك abstraction بحيث ما تحتاجش تعرف تفاصيل كثير عن ازاي البيانات و فين البيانات متخزنة او على أي أجهزة
    بعد ما خزنت البيانات, حتحتاج طريقة تقدر تكتب بيها برامج تشتغل على البيانات دي, و اللي هو بنسميه Programming Model, و ال Programming Model اللي بتستخدمه في ال Big Data يمكن اشهرهم على الاطلاق هو MapReduce و ده اللي بيخليك تقدر تكتب برامج, طبعاً ده موضوع كبير لوحده.طبعأً Hadoop فيه مكونات أساسية أكثر من كده بكثير, زي ZooKeeper و Yarn و فوق ده كله فيه تطبيقات مشهورة زي Hive و اللي بتخليك تقدر تعامل البيانات اللي على Hadoop كأنها قاعدة بيانات و تكلمها بلغة شبه ال SQL جداً اسمها HQL, و حاجات تانية زي Hbase و غيرها كثير جداً من التقنيات اللي لا يسع المجال دلوقتي اننا نتكلم فيها.
    الفكرة لو بصيت على ده كله, حتكتشف انها في النهاية كلها ادوات و تقنيات للتعامل مع البيانات, لكن نوعية التعامل ده ايه مش مشكلة ال Big Data

    نيجي لل Data Analysis و ال Data Science

    علشان نفهم الاتنين, محتاجين الأول نوصل الفكرة ان ال Data Science هو مجال بيختص بكل ماله علاقة بالبيانات, سواء بيانات Structured أو لأ, سواء محتاجة شوية تجهيز الأول, الهدف الأساسي لل Data Scientist هو انه يبحث في البيانات عن الدرر, زي الأنماط اللي بتتكرر و اللي على أساسها ممكن نتوقع حاجة تحصل في المستقبل, و ده غالباً بيكون عن طريق تطوير Models و ال Models دي ممكن تكون مبنية على حاجات زي Mathematical models, Statistical models, Machine learning, deep learning كل دي طرق مختلفة لبناء ال models اللي حتساعده انه من خلال البيانات اللي معاه دلوقتي يقدر يتوقع حاجات تحصل في المستقبل.
    ال Data Scientist عمومأً بيبقى خلفيته رياضية أو احصائية مع ال Computer Science, و ده طبعاً بيخليهم نادرين و الطلب عليهم كثير لأن الخلطة دي من المهارات مش سهلة قوي.
    و فيه مثل مشهور

    Data Scientist: A person who is better at Statistics than any Software Engineer, and better at Software Engineering than any Statistician

    و أغلب الصناعات و المجالات اللي بتتعامل مع بيانات كثير بتحتاج ناس تقدر تطلعلهم النوع ده من ال insights من البيانات, زي المؤسسات المالية, و شركات السوشيال ميديا, و التسويق و المبيعات و غيرها من المجالات.

    ال Data Analyst
    هو شخص بيتعامل مع البيانات بشكل يومي و غالباً من خلال ادوات جاهزة, زي Tableu أو حتى Excel, الفكرة انه أغلب الوقت بيكون هدفه هو الوضع الحالي أكثر من ايه اللي حيحصل في المستقبل, يعني أسئلة زي احنا عملنا مبيعات النهاردة بكام, أو عندنا كام عميل جديد, أو السنة دي مقارنة بالسنة اللي فاتت عملنا فلوس قد ايه, كلها بيانات و أسئلة مهمة, لكن أغلبها بتكون اسئلة اجابتها موجودة في البيانات أو محتاجة عمليات احصائية بسيطة, مش بالضرورة يكون عنده خلفية برمجية, و ان كان من المتوقع انه يكون عنده القدرة على التعامل مع قواعد بيانات أو البرامج الخاصة بده, مع خلفية احصائية.
    يعني لو حبينا نقول أكبر فرق بين ال Data Scientist و ال Data Analyst هو ان ال Data Scientist مشغول باستقراء المستقبل و ال Data Analyst مشغول بتقييم الواقع و الماضي.

    ده كان موضوعنا الأسبوع ده, مستنيين مقترحاتكم و اسئلتكم, و ان شاء الله نرجعلكم بموضوع جديد قريب.

    شكراً و ما تنساش تعمل Like و Subscribe و تفعل الجرس علشان يجيلك Notifications أول ما ينزل فيديو جديد.

    سلام
    Our facebook Page
    http://facebook.com/askdeveloper

    On Sound Cloud
    http://soundcloud.com/askdeveloper

    Please Like & Subscribe
    21417 Views
  • Crystal Widjaja - Pemanfaatan Big Data di dalam Bisnis GO-JEK | BukaTalks

    Subscribe: http://bl.id/subs-bukalapak

    Crystal Widjaja (SVP Business Intelligence GO-JEK) sharing mengenai penggunaan dan manfaat big data dalam mengembangkan bisnis dalam acara BukaTalks. Crystal berbagi pengalamannya tersebut selama 2 tahun bekerja di GO-JEK.

    Yuk, mari belajar dan menemukan berbagai insight bersama Crystal Widjaja GOJEK dengan menonton video ini.
    --------------------------------------------------------------------------------------------------------
    Video #BukaTalks lainnya: https://www.youtube.com/watch?v=YfCUBLzDG04&list=PLzMtIVEHDtNqirMVMEh63Or3g3nkMRbkr

    Website: https://www.bukalapak.com/

    Download Aplikasi Bukalapak di sini
    iOS: https://itunes.apple.com/id/app/bukalapak-jual-beli-online/id1003169137?l=id
    Google Play: https://play.google.com/store/apps/details?id=com.bukalapak.android

    Like / Follow Social Media Bukalapak:
    Facebook - https://www.facebook.com/Bukalapak
    Twitter - https://www.twitter.com/Bukalapak
    Instagram - https://instagram.com/bukalapak
    Google Plus - https://plus.google.com/+bukalapakdotcom
    Forum Komunitas - https://komunitas.bukalapak.com
    Stack Overflow - https://stackoverflow.com/jobs/companies/bukalapak
    LinkedIn - https://www.linkedin.com/company/pt-bukalapak-com
    154327 Views
  • Big Data vs Data Science vs Data Analytics | Demystifying The Difference | Edureka

    ** Hadoop Training: https://www.edureka.co/hadoop **
    This Edureka video on "Data Science vs Big Data vs Data Analytics" will explain you the similarities and differences between them. Also, you will get a complete insight of the skills required to become a Data Scientist, Big Data Professional, and Data Analyst.
    Below topics are covered in this video:

    1. What is Data Science, Big Data, Data Analytics?
    2. Roles and Responsibilities of Data Scientist, Big Data Professional and Data Analyst
    3. Required Skill set.
    4. Understanding how data science, big data, and data analytics is used to drive the success of Netflix.

    Check our complete Hadoop playlist here: https://goo.gl/hzUO0m

    Do subscribe to our channel and hit the bell icon to never miss an update from us in the future.

    -----------------------------------------------------------------
    How does it work?


    1. This is a 5 Week Instructor-led Online Course, 40 hours of assignment and 30 hours of project work
    2. We have a 24x7 One-on-One LIVE Technical Support to help you with any problems you might face or any clarifications you may require during the course.
    3. At the end of the training, you will have to undergo a 2-hour LIVE Practical Exam based on which we will provide you a Grade and a Verifiable Certificate!

    --------------------------------------------------------------------
    About The Course

    Edureka’s Big Data and Hadoop online training is designed to help you become a top Hadoop developer. During this course, our expert Hadoop instructors will help you:

    1. Master the concepts of HDFS and MapReduce framework
    2. Understand Hadoop 2.x Architecture
    3. Setup Hadoop Cluster and write Complex MapReduce programs
    4. Learn data loading techniques using Sqoop and Flume
    5. Perform data analytics using Pig, Hive, and YARN
    6. Implement HBase and MapReduce integration
    7. Implement Advanced Usage and Indexing
    8. Schedule jobs using Oozie
    9. Implement best practices for Hadoop development
    10. Work on a real life Project on Big Data Analytics
    11. Understand Spark and its Ecosystem
    12. Learn how to work in RDD in Spark

    ---------------------------------------------------------------------

    Who should go for this course?


    If you belong to any of the following groups, knowledge of Big Data and Hadoop is crucial for you if you want to progress in your career:
    1. Analytics professionals
    2. BI /ETL/DW professionals
    3. Project managers
    4. Testing professionals
    5. Mainframe professionals
    6. Software developers and architects
    7. Recent graduates passionate about building a successful career in Big Data

    ---------------------------------------------------------------------

    Why Learn Hadoop? Big Data! A Worldwide Problem?

    According to Wikipedia, "Big data is collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications." In simpler terms, Big Data is a term given to large volumes of data that organizations store and process. However, it is becoming very difficult for companies to store, retrieve and process the ever-increasing data. If any company gets hold on managing its data well, nothing can stop it from becoming the next BIG success!

    The problem lies in the use of traditional systems to store enormous data. Though these systems were a success a few years ago, with increasing amount and complexity of data, these are soon becoming obsolete. The good news is - Hadoop has become an integral part for storing, handling, evaluating and retrieving hundreds of terabytes, and even petabytes of data.

    ---------------------------------------------------------------------

    Opportunities for Hadoopers!

    Opportunities for Hadoopers are infinite - from a Hadoop Developer, to a Hadoop Tester or a Hadoop Architect, and so on. If cracking and managing BIG Data is your passion in life, then think no more and Join Edureka's Hadoop Online course and carve a niche for yourself! Please write back to us at sales@edureka.co or call us at +91 88808 62004 for more information.

    ---------------------------------------------------------------------

    Got a question on the topic?
    Please share it in the comment section below and our experts will answer it for you.

    For Hadoop Training and Certification, Call us at US: +18336900808 (Toll-Free) or India: +918861301699 Or, write back to us at sales@edureka.co

    Instagram: https://www.instagram.com/edureka_learning/
    Facebook: https://www.facebook.com/edurekaIN/
    Twitter: https://twitter.com/edurekain
    LinkedIn: https://www.linkedin.com/company/edureka
    8434 Views
The Number One Menace to All Organizations
 

Learn more about how to protect your organization against this growing menace
https://info.knowbe4.com/ransomware-simulator-tool-its

 

Big Data News