SIMSTAT 

Opatrenia na ďalšie zníženie zaťaženia 

Okrem informačných potrieb Štatistický úrad Slovenskej republiky sleduje záujmy spravodajských jednotiek pri zvyšovaní zodpovednosti. Vždy, ak je to možné, by sa malo zaťaženie spojené s o zberom údajov v systéme intrakomunitárneho obchodu znížiť. 

Nasledujúci výber poskytuje prehľad opatrení, ktoré budú v najbližších rokoch práve na to zamerané: 

  • Opätovné vnímanie ekonomických účtov
    Zber údajov sa stáva efektívnejším prostredníctvom využívania administratívnych údajov a zlepšeného procesu cez elektronickú komunikáciu a spracovanie údajov. 
  • Zvýšené využívanie postupov odhadu 
    Použitie metodiky imputácií pri zbere údajov môže znížiť potrebu kontaktu so spravodajskými jednotkami. 
  • Zavedenie metódy jednosmerného toku vo vnútri obchodu (SIMSTAT)
    S cieľom minimalizovať zaťaženie spoločností podliehajúcich vykazovaniu.
  • Skúma sa používanie takzvaného systému s jedným tokom v rámci obchodu. 

  • Duplicita sa odstráni zberom údajov o prichádzajúcich tovaroch. 

  • Pre relevantnosť údajov sa použijú zrkadlové účty a údaje o zásielkách partnerských krajín EÚ.

  • Vývoj metód zmiešaného prieskumu 
    Ponuka rôznych prieskumných nástrojov v rámci prieskumu (zmiešaný režim) umožňuje respondentom vybrať si pre ne najvýhodnejšiu metódu. 
  • Ďalší rozvoj prieskumného portálu
    Prostredníctvom centrálneho portálu oficiálnych štatistík sú všetky prístupy k on-line správam už prístupné a ponúkajú aj informačné a automatizačné pomôcky. Vytvorenie portálu by malo byť založené na hodnotení a ďalšom rozvoji založenom na potrebách.
  • Pilotovanie využívania telekomunikačných prenosov
    Telekomunikačné údaje majú v súčasnosti v oblasti témy "relevantné údaje" najväčší potenciál, aby sa výrazne znížilo úsilie o zber údajov. Okrem technických záležitostí sa musia pre pilotný postup preskúmať právne rámcové podmienky.

Metodika imputácie 

Využívanou technikou resp. prístupom pre minimalizáciu vplyvu non-response je imputácia, tzn. nahradenie chýbajúcich údajov na základe súboru pomocných údajov. 

Úplná imputácia údajov dopĺňa všetky chýbajúce hodnoty pre prvky s jednou alebo viac chýbajúcimi hodnotami. Výsledná dokončená obdĺžniková matica dát má rozmer n x I, kde n je veľkosť vzorky a I je počet stĺpcov (počet premenných y). 

Imputácia je postup, ktorým sú chýbajúce hodnoty pre jednu alebo viac skúmaných premenných "nahradené resp. vyplnené" hodnotami "náhradníkmi". Tieto náhradné hodnoty môžu byť získané rôznymi spôsobmi. Imputované hodnoty sú samozrejme umelé a obsahujú chyby. Chyba imputácie je podobná chybe merania, v tom, že hodnoty zaznamenané v dátovom súbore nie sú "pravé hodnoty", okrem naozaj výnimočných prípadov. 

Dopočítané hodnoty možno rozdeliť do troch hlavných kategórií: 

  • (I) hodnoty postavené pomocou štatistických prognostických metód; 
  • (II) zistené hodnoty nielen pre neodpovedajúce (non-response) prvky, ale aj pre (podobné) odpovedajúce prvky; 
  • (III) hodnoty postavené na znaleckom posudku. 

Kategórie (I) a (II) môžu byť nazývané štatistickými metódami, pretože používajú bežné štatistické techniky pri tvorbe náhradných hodnôt. 

Kategória (I) je často založená na predpokladanom vzťahu medzi premennými, ako v regresii.

Kategória (II) sú metódy, ktoré môžu byť opísané ako "darcovské". Sú založené na imputovaní hodnôt z podobných alebo veľmi podobných pozorovaných prvkov. 

Kategória (III) sú metódy sa spoliehajúce sa na odborné expertné zručnosti a znalosti o špecifickom prvku, ktorý vyžaduje imputácie. 

Ďalšie často používané rozlíšenie je, že imputované hodnoty sú buď deterministické (pri opakovanej imputácii by priniesla úplne rovnaké dopočítané hodnoty) alebo náhodné (pri opakovaní postupu bude hodnota pridelená náhodne a vedú k rôznym dopočítaným hodnotám). 78 Imputácia podľa štatistických pravidiel 

Je potrebné rozlišovať imputácie podľa štatistických pravidiel od špeciálnych imputácií. Špeciálne imputácie sú pomocou odborného posúdenia alebo z historických dát. Sú zvyčajne použité len pre pár veľmi vplyvných a významných prvkov. 

Bežne používané druhy štatistických výpočtových pravidiel sú: 

  • regresná imputácia, 
  • pomerná imputácia (ratio imputation) a imputácia strednou hodnotou (respondent mean imputation),
  • metóda imputácie najbližšieho suseda, 
  • hot deck imputácia. 

Regresná imputácia a metóda imputácie najbližšieho suseda vyžadujú pomocné informácie. Vznikajú deterministické imputácie. Imputovaný pomocný vektor je označovaný xk = (x1k ,..., xjk,..., xJk ) a je zložený z hodnoty jednej alebo viacerých premenných imputácie. 

Pomerná imputácia (ratio imputation) a imputácia strednou hodnotou (respondent mean imputation) sa používajú len v špeciálnych prípadoch. 

Metóda ratio imputácie sa používa, keď je rovnaká premenná meraná vo dvoch rôznych prípadoch v opakovaných prieskumoch. 

Imputácia najbližším susedom a imputácia hot deck sú založené na metóde donor (darcu alebo darovania), čo znamená, že imputované hodnoty sú vlastne napozorovanými hodnotami, ale pre iný prvok (element). To poskytuje záruku, že imputované hodnoty sú také, ktoré reálne môžu nastať. Hot deck, ako je opísané nižšie, je metóda náhodnej imputácie, zatiaľ čo imputácia metódou najbližšieho suseda je deterministická. 

Imputácia expertným odhadom alebo na základe historických dát Imputácia je zvyčajne motivovaná požiadavkou mať "čo najlepšie imputované hodnoty" na každý základný prvok. Praktickou výhodou je, že ju možno zvyčajne vykonávať mechanicky pomocou existujúcich počítačových softvérov. 

V prípade, že vybraný prvok (napr. spravodajská jednotka) je významný, jedinečný, nie je možné uplatniť štatistické pravidlá. Je nevyhnutné využiť skôr historické údaje alebo expertné odhady. Kombinácia váženia a imputácie, znamená, že sa imputujú len obmedzené položky nonresponse.

Imputuje sa pre m počet prvkov, ktorým chýba aspoň jedna, ale nie všetky hodnoty y. Výsledok je matica dát s rozmerom m x I, pričom m - je počet prvkov a I je počet stĺpcov (počet premenných y). Na riešene jednotkovej nonresponse (neodpovedanie celej jednotky) je potom uplatnená metóda váženia. Práve kombinácia váženia a imputácie bude využitá pri riešení problému nonresponse.