Loading Events

« All Events

Data types, indexing, cleaning and preparation – for beginners!

December 14 @ 7:00 pm - 9:00 pm UTC+0

The next meetup is on December 14. This is suitable for beginners – it is a good continuation of the beginners’ workshop this fall.

During the session we solidify our knowledge of fundamental data structures in R and then learn efficient approaches of preparing data sets for analysis. First topic is very important for beginners: we must clearly understand how data are stored in R.
Here we will discuss basic data types (vectors of logical, integer, numeric, character values) and more advanced types (lists and data frames). Also we will touch element indexing in R (e.g. why there are three ways to extract elements from a list: dollar sign, square brackets and double square brackets).

Second part is useful to get more efficient and faster at data cleaning and preparation. It’s a common problem for data scientists: we spend about 80% of our time moving cells, rows and columns around to get them ready for a specific analytical procedure. So to get more job done we must be efficient in data management. We will look at two modern R packages: dplyr and tidyr. They are like a Swiss Army knife for a data scientist, and we have low chances to survive in R community without them. These packages allow us to produce more elegant code that leads to faster development and reduces risk of errors. 30 minutes of Excel spreadsheet tasks can be completed with 3 lines of R code with these packages.

The meetup will be hosted by Alexander Matrunich, in English.

================================================

შემდეგი შეხვედრა გაიმართება 14 დეკემბერს. ეს შეხვედრა, რომელიც კარგი გაგრძელებაა შემოდგომის სემინარებისა, ორიენტირებული იქნება დამწყებებზე. ამ სესიაზე გავამყარებთ ჩვენს ცოდნას მონაცემთა სტრუქტურაზე და ვისწავლით სასარგებლო გზებს მონაცემების მოსამზადებლად ანალიზისთვის. პირველი თემა ძალიან მნიშვნელოვანია დამწყბეთათვის: ჩვენ კარგად უნდა გავიგოთ, თუ როგორაა მონაცემები დახარისხებული R-ში. განვიხილავთ მონაცემთა საბაზისო და უფრო რთულ ტიპებს. ასევე შევეხებით ინდექსირებას. მეორე ნაწილი შეეხება მონაცემების სწრაფ გაწმენდასა და მომზადებას. ეს მონაცემთა მეცნიერებისთვის ცნობილი პრობლემაა: ჩვენ ჩვენი დროის 80%–ს სწორედ მონაცემთა მომზადებაში ვხარჯავთ კონკრეტული ანალიზისთვის. ჩვენ გამოვიყენებთ ორ თანამედროვე პაკეტს: dplyr და tidyr. ისინი ძანიალ მნიშვნელოვანია მონაცემთა ანალიზისთვის და მათ გარეშე ძნელი იქნება R-ში მუშაობა. ეს პაკეტები საშუალებას გვაძლევს დავწეროთ დახვეწილი კოდები, რომლებიც შეამცირებს მომავალი ხარვეზების არსებობის ალბათობას. ექსელის სამუშაო, რომელსაც სჭირდება 30 წუთი, R-ში შეიძლება გაკეთდეს 3 ხაზით, ამ პაკეტების კოდების საშუალებით. შეხვედრა გაიმართება ინგლისურ ენაზე და მას უმასპინძლებს ალექსანდრე მატრუნიხი.

Details

Date:
December 14
Time:
7:00 pm - 9:00 pm
Event Category:
Website:
https://www.meetup.com/rladies-tbilisi/events/245694374/

Organizer

R-Ladies Tbilisi