Curs Online

Web scraping with Python

Banea Daiana-Elena

Senior Python & Cloud Engineer @ LSEG

Află mai multe
Data: 1 Octombrie –
8 Noiembrie 2024
Durata:

12 lecții, 6 săptămâni

Marți & Joi, 18:30 – 20:00

În 12 lecții vei stăpâni skill-ul de web scraping - de la monitorizarea informațiilor până la căutarea lead-urilor și evitarea blocajelor — și află cum să creezi propriile soluții pentru a extrage informațiile necesare din diverse surse web.

Cursul ideal pentru tine dacă ești:
Junior/Middle Developer

Vei naviga prin structuri complexe ale site-urilor web și vei extrage eficient datele necesare folosind librării precum Requests pentru a implementa concepte specifice protocolului HTTP și Beautiful Soup pentru manipularea datelor HTML și XML La finalul cursului, vei putea să gestionezi mecanismele anti-scraping și să asiguri calitatea datelor.

Specialist în Data Science și Data Analyst

Vei explora strategii avansate de curățare și prelucrare a datelor obținute prin scraping și vei folosi regular expressions, DOM parsing și XPath pentru a localiza și extrage informațiile relevante de pe site-uri web. Vei învăța să procesezi și să stochezi datele extrase în formate .csv, .json sau în baze de date.

Cunoștințe de bază despre Python

Învață cum să utilizezi Python pentru a optimiza activitatea afacerii și pentru a obține informații de calitate despre clienți și concurenți. Află cum să creezi scripturi de web scraping care îți vor permite să monitorizați informațiile relevante, să cauți lead-uri valoroase și să evitați blocajele impuse de diverse site-uri web.

Subiecte pe care le vei discuta:
01
BAZELE WEB SCRAPING

Vei studia conceptele de bază ale web scraping-ului, aspectele legale, metodele de extragere a datelor de pe paginile web folosind RegEx, selectori CSS și XPath. De asemenea, vei examina tehnici de evitare a protecției site-urilor, inclusiv utilizarea user-agent-ului și a proxy-urilor.

02
PROCESAREA VOLUMELOR MARI DE DATE

Cu ajutorul principalelor biblioteci și framework-uri Beautiful Soup, Scrapy, Selenium, vei învăța să automatizezi colectarea și procesarea unor volume mari de informații, pentru a avea flexibilitate în alegerea abordării de scraping.

03
CREAREA SCRAPER-ELOR

Programul este 70% practic — pentru exersarea lucrului cu diferite blocaje și formate. La finalul cursului vei avea 4 scrapers gata de utilizare pentru fiecare bibliotecă, precum și un proiect de curs pentru portofoliu.

Lector
Banea Daiana-Elena
Senior Python & Cloud Engineer @ LSEG
Experiență de lucru ca Python Developer & Python Data Engineer
Responsabilitățile principale includ proiectarea, implementarea și testarea soluțiilor software, automatizarea operațiilor bazelor de date, analiza exploratorie a datelor, prelucrarea și agregarea datelor pentru machine learning
A creat și susținut traininguri de Python, inițial fizic și ulterior online, pentru colegii din consultanță și studenți la ASE București
Din toamna anului 2022, predă noțiuni de bază din Python și SQL pentru cursanți începători în IT
Deține certificări importante, printre care Machine Learning Specialty (AWS), Azure Data Engineer Associate (Microsoft) și AWS Certified Cloud Practitioner (AWS)
PROGRAM
Înscrie-te la curs

Completează formularul de înscriere pentru a primi mai multe
detalii despre curs și taxa de participare.

Câmp obligatoriu