Web Scraping with Python Training Course
Web Scraping je technika pro extrahování dat z webové stránky a jejich uložení do místního souboru nebo databáze.
Toto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí použít Python k automatizaci procesu procházení mnoha webových stránek k získávání dat pro zpracování a analýzu.
Na konci tohoto školení budou účastníci schopni:
- Nainstalovat a nakonfigurovat Python a všechny relevantní balíčky.
- Získávat a parsovat data uložená na mnoha webových stránkách.
- Pochopit, jak webové stránky fungují a jak je strukturován jejich HTML.
- Vytvořit spidery pro procházení webu ve velkém měřítku.
- Použít Selenium pro procházení webových stránek řízených AJAX.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Spousta cvičení a praxe.
- Praktická implementace v živém laboratorním prostředí.
Možnosti přizpůsobení kurzu
- Tento kurz předpokládá znalost programování.
- Pro požadavek na přizpůsobené školení pro tento kurz nás prosím kontaktujte a domluvte se.
Návrh Školení
Úvod
Nastavení vývojového prostředí
Python Primer: datové struktury, podmíněné podmínky, zpracování souborů atd.
Python Balíčky pro Web Scraping: Scrapy a BeautifulSoup
Jak web funguje
Jak je HTML strukturováno
Vytvoření webového požadavku
Seškrábání stránky HTML
Práce s XPath a CSS
Filtrování dat pomocí běžných Expressiontů
Vytvoření webového prohledávače
Procházení stránek AJAX a JavaScript pomocí Selenium.
Doporučené postupy pro škrábání webu
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Programming zkušenosti, ideálně v Python. Pokud mají účastníci programátorské zkušenosti v jiném jazyce než Python, může být školení rozšířeno o další úvodní cvičení v Python.
Publikum
- Vývojáři
Open Training Courses require 5+ participants.
Web Scraping with Python Training Course - Booking
Web Scraping with Python Training Course - Enquiry
Web Scraping with Python - Consultancy Enquiry
Consultancy Enquiry
Reference (1)
Many different examples and topics has been covered, from basic investigation to login management and dynamic page management.
Daniele Tagliaferro - Creditsafe Italia Srl
Kurz - Web Scraping with Python
Upcoming Courses
Související kurzy
BDD with Python and Behave
7 hodinyThis instructor-led, live training in České republice begins with a discussion of BDD and how the Behave framework can be used to carry out BDD testing for web applications. Participants are given ample opportunity to interact with the instructor and peers while implementing the concepts and tactics learned in this hands-on, practice-based lab environment.
Na konci tohoto školení budou mít účastníci pevné pochopení BDD a Behave, stejně jako nezbytnou praxi pro implementaci těchto technik a nástrojů v reálných testovacích scénářích.
Scaling Data Analysis with Python and Dask
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a softwarové inženýry, kteří chtějí používat Dask s Python ekosystémem k vytváření, škálování a analýze velkých datových sad.
Na konci tohoto školení budou účastníci schopni:
- Nastavte prostředí, abyste mohli začít budovat zpracování velkých dat pomocí Dask a Python.
- Prozkoumejte funkce, knihovny, nástroje a rozhraní API dostupné v Dask.
- Pochopte, jak Dask urychluje paralelní výpočty v Pythonu.
- Naučte se, jak škálovat ekosystém Pythonu (Numpy, SciPy a Pandas) pomocí Dask.
- Optimalizujte prostředí Dask pro udržení vysokého výkonu při zpracování velkých datových sad.
Data Analysis with Python, Pandas and Numpy
14 hodinyTento vedený instruktorem živý školení na místě nebo online je určen pro středně pokročilé Python vývojáře a analytiky dat, kteří chtějí posílit své dovednosti v analýze a manipulaci s daty pomocí Pandas a NumPy.
Do konce tohoto školení budou účastníci schopni:
- Nastavit vývojové prostředí, které zahrnuje Python, Pandas a NumPy.
- Vytvořit aplikaci pro analýzu dat pomocí Pandas a NumPy.
- Provádět pokročilou manipulaci s daty, řazení a filtrování operací.
- Provádět agregované operace a analyzovat časové série dat.
- Vizualizovat data pomocí Matplotlibu a dalších knihoven pro vizualizaci.
- Ladit a optimalizovat svůj kód pro analýzu dat.
FARM (FastAPI, React, and MongoDB) Full Stack Development
14 hodinyToto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí používat zásobník FARM (FastAPI, React a MongoDB) k vytváření dynamických, vysoce výkonných a škálovatelných webových aplikací.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné vývojové prostředí, které integruje FastAPI, React a MongoDB. Pochopte klíčové koncepty, funkce a výhody FARM stacku. Naučte se vytvářet REST API pomocí FastAPI. Naučte se navrhovat interaktivní aplikace pomocí React. Vyvíjejte, testujte a nasazujte aplikace (front-end a back-end) pomocí FARM stacku.
Developing APIs with Python and FastAPI
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí používat FastAPI s Python ke snadnějšímu a rychlejšímu vytváření, testování a nasazování RESTful API.
Na konci tohoto školení budou účastníci schopni:
- Nastavit si nezbytné vývojové prostředí pro vývoj API s Python a FastAPI.
- Vytvářet API rychleji a snadněji pomocí knihovny FastAPI.
- Naučit se, jak vytvářet datové modely a schémata založené na Pydantic a OpenAPI.
- Připojit API k databázi pomocí SQLAlchemy.
- Implementovat zabezpečení a autentizaci v API pomocí nástrojů FastAPI.
- Vytvořit kontejnerové obrazy a nasadit webová API na cloudový server.
Machine Learning with Python – 2 Days
14 hodinyCílem tohoto kurzu je poskytnout základní dovednosti při uplatňování Machine Learning metod v praxi. Prostřednictvím používání Python programovacího jazyka a jeho různých knihoven a na základě mnoha praktických příkladů se tento kurz učí, jak používat nejdůležitější stavební bloky Machine Learning, jak činit data modelování rozhodnutí, interpretovat výstupy algoritmů a validovat výsledky.
Naším cílem je poskytnout vám dovednosti k pochopení a důvěryhodnému používání nejzákladnějších nástrojů z nástrojové krabice Machine Learning a vyhnout se běžným úderům aplikací Data Science.
Machine Learning with Python – 4 Days
28 hodinyCílem tohoto kurzu je poskytnout obecné znalosti v aplikaci metod strojového učení v praxi. Pomocí programovacího jazyka Python a jeho různých knihoven a na základě množství praktických příkladů tento kurz učí, jak používat nejdůležitější stavební bloky strojového učení, jak se rozhodovat o datovém modelování, interpretovat výstupy algoritmy a ověřovat výsledky.
Naším cílem je poskytnout vám dovednosti, abyste rozuměli a používali nejzákladnější nástroje z Machine Learning sady nástrojů s jistotou a vyhnuli se běžným nástrahám aplikací Data Sciences.
Accelerating Python Pandas Workflows with Modin
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a vývojáře, kteří chtějí používat Modin k sestavení a implementaci paralelních výpočtů s Pandas pro rychlejší analýzu dat.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné prostředí, abyste mohli začít vyvíjet pracovní postupy Pandas ve velkém měřítku s Modin.
- Pochopte funkce, architekturu a výhody Modin.
- Poznejte rozdíly mezi Modin, Dask a Rayem.
- Pomocí Modin provádějte operace Pandas rychleji.
- Implementujte celé Pandas API a funkce.
Python for Natural Language Generation (NLG)
21 hodinyV tomto instruktážním živém tréninku v České republice se účastníci naučí používat Python pro výrobu kvalitního textu v přirozené řeči, postupně sestavují vlastní systém NLG. Budou rovněž analyzovány případové studie a relevantní koncepty budou aplikovány na živých laboratorních projektech pro generování obsahu.
Koncem tohoto tréninku budou účastníci schopni:
- Používat NLG k automatickému generování obsahu pro různé odvětví, od tiskárny po nemovitosti a zprávy o počasí a sportu.
- Vybírat a organizovat zdrojový obsah, plánovat věty a připravovat systém pro automatické generování originálního obsahu.
- Pochopit průmyslovou linii NLG a aplikovat správné techniky na každém stupni.
- Pochopit architekturu Natural Language Generation (NLG) systému.
- Implementovat nejvhodnější algoritmy a modely pro analýzu a uspořádání.
- Dobyvat data ze veřejných zdrojů i z kurátorovských databází k použití jako materiál pro generovaný text.
- Nahrazovat ruční a pracné procesy psaní počítačem generovaným, automatizovaným vytvářením obsahu.
Unit Testing with Python
21 hodinyV tomto instruktorem vedeném živém školení v České republice se účastníci naučí, jak používat PyTest k psaní krátkých, udržovatelných testů, které jsou elegantní, výrazné a čitelné.
Na konci tohoto školení budou účastníci schopni:
- Pište čitelné a udržovatelné testy bez potřeby standardního kódu.
- Použijte model přípravku k psaní malých testů.
- Škálujte testy až po komplexní funkční testování aplikací, balíčků a knihoven.
- Pochopte a použijte funkce PyTest, jako jsou háčky, přepisování a zásuvné moduly.
- Zkraťte dobu testování spuštěním testů paralelně a napříč více procesory.
- Spouštějte testy v prostředí kontinuální integrace spolu s dalšími nástroji, jako je tox, mock, coverage, unittest, doctest a Selenium.
- Použijte Python k testování aplikací, které nejsou Python.
Advanced Machine Learning with Python
21 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí nejrelevantnější a nejmodernější techniky strojového učení v Python při vytváření řady demo aplikací zahrnujících obrázky, hudbu, text a finanční data.
Na konci tohoto školení budou účastníci schopni:
- Implementujte algoritmy a techniky strojového učení pro řešení složitých problémů.
- Aplikujte hluboké učení a výuku s částečným dohledem na aplikace zahrnující obrázky, hudbu, text a finanční data.
- Posuňte Python algoritmy na jejich maximální potenciál.
- Používejte knihovny a balíčky jako NumPy a Theano.
Python: Automate the Boring Stuff
14 hodinyToto živé školení vedené instruktorem v České republice je založeno na populární knize „Automatizujte nudné věci pomocí Python“ od Ala Sweigarta. Je zaměřena na začátečníky a prostřednictvím praktických praktických cvičení a diskuzí pokrývá základní Python programovací koncepty. Důraz je kladen na učení se psát kód pro dramatické zvýšení produktivity kanceláře.
Na konci tohoto školení budou účastníci vědět, jak programovat v Python a používat tuto novou dovednost pro:
- Automatizaci úkolů psaním jednoduchých Python programů.
- Psaní programů, které dokážou rozpoznávat textové vzory pomocí „regulárních výrazů“.
- Programové generování a aktualizaci Excel tabulek.
- Parsování PDF a Word dokumentů.
- Procházení webových stránek a získávání informací z online zdrojů.
- Psaní programů, které odesílají e-mailová upozornění.
- Používání ladicích nástrojů Python pro rychlé odstraňování chyb.
- Programové ovládání myši a klávesnice pro klikání a psaní za vás.
Advanced Python - 4 Days
28 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí pokročilé Python programovací techniky, včetně toho, jak aplikovat tento všestranný jazyk k řešení problémů v oblastech, jako jsou distribuované aplikace, analýza a vizualizace dat, programování uživatelského rozhraní a skriptování údržby. .
Python Programming - 4 days
28 hodinyTento kurz je určen pro ty, kteří se chtějí naučit programovací jazyk Python. Důraz je kladen na jazyk Python, základní knihovny a také na výběr nejlepších a nejužitečnějších knihoven vyvinutých komunitou Python. Python pohání podniky a je používán vědci po celém světě – je to jeden z nejpopulárnějších programovacích jazyků.
Kurz lze realizovat s využitím nejnovější verze Python 3.x s praktickými cvičeními, které využívají jeho plný potenciál. Kurz je možné realizovat na jakémkoli operačním systému (všechny varianty UNIX, včetně Linux a Mac OS X, stejně jako Microsoft Windows).
Praktická cvičení tvoří asi 70 % času kurzu a asi 30 % tvoří demonstrace a prezentace. Během kurzu lze diskutovat a klást otázky.
Poznámka: školení lze přizpůsobit konkrétním potřebám na základě předchozí žádosti před navrhovaným termínem kurzu.
Test Automation with Selenium and Python
14 hodinyV tomto živém školení vedeném instruktorem pro účastníky České republice se spojuje síla Pythonu s Selenium k automatizaci testování ukázkové webové aplikace. Spojením teorie s praxí v prostředí živé laboratoře získají účastníci znalosti a praxi potřebnou k automatizaci vlastních projektů testování webu pomocí Pythonu a Selenium.