Magyar Szövegfeldolgozás

v1.0.0

Magyar nyelvű szövegek elemzése, összefoglalása, kulcsszó- és entitáskinyerése, valamint érzelem- és témaazonosítás magyar tartalmakhoz.

0· 177· 1 versions· 0 current· 0 all-time· Updated 12h ago· MIT-0

Install

openclaw skills install magyar-szovegfeldolgoz-s

Magyar Szövegfeldolgozás

Áttekintés

Magyar nyelvű szövegek automatikus feldolgozása: elemzés, kivonatolás, összefoglalás, és kulcsszó kinyerés.

Mikor használd

  • Szöveg összefoglalás: hosszú magyar cikk tömörítése
  • Kulcsszó kinyerés: fontos szavak kigyűjtése magyar szövegből
  • Téma azonosítás: miről szól a magyar tartalom
  • Érzelem elemzés: pozitív/negatív hangulat magyar szövegben
  • Entitás kinyerés: nevek, helyek, dátumok magyar szövegben

Működés

1. Szöveg összefoglalás

def summarize_hungarian(text, max_sentences=3):
    # 1. Mondatokra bontás (magyar mondatvégi jelek: . ! ?)
    sentences = split_sentences(text)
    # 2. Fontossági súlyozás (kulcsszavak, pozíció)
    scored = score_sentences(sentences)
    # 3. Top N mondatok visszaadása
    return get_top_sentences(scored, max_sentences)

2. Kulcsszó kinyerés

def extract_keywords(text, top_n=5):
    # 1. Tokenizálás (magyar szóelemzés)
    tokens = tokenize(text)
    # 2. Stopwords szűrés (magyar stopword lista)
    filtered = remove_stopwords(tokens)
    # 3. Gyakoriság alapú rangsor
    return get_top_words(filtered, top_n)

3. Entitás kinyerés (NER)

  • Személyek: keresztnevek, vezetéknevek
  • Helyek: városok, országok, címek
  • Dátumok: magyar dátum formátumok (YYYY-MM-DD, "március 18")
  • Számok: pénzek, mennyiségek

Referenciák

  • references/szovegertes.md – magyar szövegértés best practices, kontextus megőrzés
  • references/stopwords.txt – magyar stopwords lista
  • references/magyar-regex.md – magyar szöveg regex minták
  • references/ner-patterns.md – entitás kinyerés minták

Scriptek

  • scripts/summarize.py – magyar szöveg összefoglalás
  • scripts/keywords.py – kulcsszó kinyerés
  • scripts/ner.py – entitás kinyerés

Szövegértés javítás

Lásd references/szovegertes.md:

  • Szólások, metaforák értelmezése
  • Többjelentésű szavak feloldása
  • Kontextus megőrzés több fordulós párbeszédben
  • Érzelem elemzés, téma azonosítás

Jegyzetek

  • Magyar agglutináló nyelv: szóvégi toldalékok kezelése fontos
  • Stopword lista kritikus a kulcsszó kinyeréshez
  • Helyi NLP modellek (pl. HunFlair) ha elérhetők

Version tags

latestvk971p9175ak78m3m5ez0xjajsn835dtp