Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část
Datum publikování: 21. 11. 2024
Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.