Statistiska stickprov i revisionsarbetet – en modenyck för 20 år sedan eller....

Statistiska stickprov är ett av många hjälpmedel i revisionsarbetet. Auktor revisor Erik Rydström och civilekonom Bernt Gyllenswärd redogör i denna artikel för hur granskning med hjälp av stickprov kan ske och hur stickprovstekniken utvecklats och anpassats till de speciella krav som revisorerna ställer.

Vad har egentligen hänt med statistiska stickprov sedan de på femtiotalet och början av sextiotalet med dunder och brak lanserades såsom revolutionerande hjälpmedel vid revisionsarbetet? Utvecklingen av tekniken har knappast varit särskilt lyckosam och de höga förväntningarna har snarast förbytts i tystnad och misstro. Det förefaller dock som om stickprovstekniken har utvecklats en hel del sedan 50–60-talen, men den har inte längre samma glamorösa framtoning som på den tiden. Det har blivit vanligt att statistiska stickprov använts såsom hjälpmedel i revisionsarbetet. Användningen tycks dock vara rätt begränsad och många revisorer förefaller vara skeptiska över användningsmöjligheterna.

En orsak till att utvecklingen har gått mycket långsamt kan bl a antas vara att tekniken från början utvecklades av statistiker. De metoder som rekommenderades var icke alltid de som var mest lämpade för revisionsändamål. Resultaten var också svåra att använda av revisorer. Revisorer i allmänhet hade också dåliga kunskaper i statistik och var inte i stånd att utnyttja den nya tekniken effektivt och inte heller kunde de kommunicera effektivt med statistikerna. Vissa som använder eller har använt tekniken förfaller också till att ganska urskillningslöst utnyttja ”lathundar” i form av tabeller. I dessa är vissa för urvalet väsentliga förutsättningar givna, förutsättningar som alltså då utan att ifrågasättas tillämpas på materialet. Detta gäller t ex förväntad felfrekvens och konfidensnivå. Vad detta kan innebära för ett stickprovs resultat behöver inte närmare utvecklas, men att risken för att felaktiga slutsatser dras är mycket stor är självklart.

Stickprov – en del av revisionen

Stickprov får ej ses som en isolerad del av revisionen, utan resultatet från en stickprovsgranskning skall givetvis ingå i den totala bilden, inklusive alla de andra tester, kontroller och inventeringar som görs.

På motsvarande sätt skall vid bestämmande av t ex konfidensnivå vid ett stickprov den totala informationen utnyttjas för att modifiera denna. Frågan uppkommer då hur man skall kunna värdera denna samlade information på ett för urvalet relevant sätt.

Sannolik felfrekvens i materialet kan med stor säkerhet erhållas från tidigare års revisioner i företaget ifråga. Andra metoder används för att konstatera kvalitén på den interna kontrollen m m. Svar på standardfrågor ger en uppfattning om systemets starka och svaga punkter och genom fördjupade kontroller av utvalda delar testas om systemet fungerar som angivits. Denna information behöver ej ha insamlats genom slumpmässigt urval, varför konventionella statistiska metoder för utvärdering normalt inte kan användas. Resultaten påverkar dock revisorns inställning och hans uppfattning om den troliga felnivån i systemet grundar sig på dem.

Om man i en statistisk analys skall använda sig av osäkerheten i nämnda slags information måste graden av osäkerhet fastställas med hjälp av sannolikheter. Informationens kvalitetsvärde måste införlivas kvantitativt i en sannolikhetsfördelning.

God intern kontroll, pålitlig personal, tillfredsställande tidigare revisioner pekar mot en viss trolig felfrekvens och varje avvikelse från denna skulle vara en överraskning. Dålig intern kontroll tyder på en högre felfrekvens och större osäkerhet om den troliga felfrekvensen, så att avvikelser från denna inte skulle framkalla någon sådan förvåning. Kan då mer eller mindre subjektiva uppfattningar av detta slag översättas till sannolikhetsfördelningar? Det är svårt, men det går genom att använda metoder att uppskatta sannolikheter för olika utfall.

Vi skall inte här fördjupa oss i denna problematik, men för den som är ytterligare intresserad kan hänvisas till det s k ”Bayes Theorem” som finns beskrivet i de flesta läroböcker i statistik.

Låga felfrekvenser

Den totala felfrekvensen i de populationer revisorn skall undersöka är ofta mycket låg. Att finna en sällan förekommande händelse i en sådan population kan jämföras med att finna en nål i en höstack.

Problemet med sådana händelser är att man även vid stora stickprov kan misslyckas att finna dem. Dessutom tar man vid normala statistiska metoder ingen hänsyn till felens penningvärden. Ett fel på 10 kronor behandlas på samma sätt som ett på 10.000 kronor. Det är dock oftast felens storlek, deras effekt på totalmaterialet, som är av verklig betydelse. I den slutliga analysen av det reviderade företaget är det felens totala påverkan som återspeglas i revisorns uppfattning, huruvida redovisningen ger en riktig och rättvisande bild av ställning och resultat.

Hur kan då händelser värderas om de sällan upptäcks? Ytligt sett förefaller felvärdering vara en enkel applikation för skilda estimeringsmetoder. Dessa metoder är dock endast effektiva vid ofta förekommande händelser, varför de ej är användbara i nämnda fall. Det kan i förbigående nämnas, att den enda statistiska fördelning som kan användas här är Poissonfördelningen. Vi måste då hitta en metod för att värdera fel i en Poissonsituation.

Urvalsstrategier

För att klargöra några urvalsstrategier skall några urval från andra områden kort diskuteras.

Mänskliga urval besitter den stora fördelen att individerna i populationen kan ”tala” eller kommunicera på annat sätt. Detta gör att man kan skapa grupper, strata, inom vilka de sällsynta egenskaperna uppträder frekvent, genom att använda en metod som kallas ”snöbollsurval”. Om man t ex vill nå så många ägare till minkpälsar som möjligt, skulle förmodligen ett slumpmässigt urval inte innehålla någon ägare. Å andra sidan kan en snabb genomgång av damtidningar identifiera några pälsägare. Dessa kan kontaktas och i sin tur namnge ytterligare några ägare och så vidare tills man erhållit ett för undersökningen tillräckligt antal. Denna population bildar stratat för den sällan inträffade företeelsen. Motsvarande metod har framgångsrikt använts för att t ex förteckna människor med sällsynta sjukdomar. Tyvärr kan dock inte räkenskaper tala, varför metoden ur revisionssynpunkt oftast inte har något större värde.

En annan billig metod är att utvälja grupper, clusters, i stället för individuella poster, och om ett helt cluster kan undersökas med avseende på förekomst/frånvaro av den sällsynta företeelsen är det möjligt att kontrollera stora stickprov. Ett klassiskt exempel på detta är blodkontroll för att upptäcka vissa sjukdomar. Varje individ får lämna ett blodprov och dessa blandas i grupper för testning. Om sjukdomen ej kan påvisas i en viss grupp kan direkt konstateras att hela gruppen är frisk. Kan å andra sidan sjukdomen påvisas, utväljs mindre och mindre cluster tills de drabbade individerna slutligen kan utpekas. Denna urvalsmetod kan i vissa fall utnyttjas för revisionsändamål.

Den mest använda tekniken är dock att, med erfarenhetsmässig kännedom om materialet, identifiera känsliga delar ”nyckelareor” av populationen. Dessa nyckelareor granskas intensivt, kanske totalt, medan ett slumpmässigt urval utnyttjas på resten av materialet. Denna metod kombinerad med clusterurval kan vara ett mycket effektivt sätt att upptäcka sällan förekommande händelser.

En metod som på senare tid börjar utnyttjas för revisionsändamål är den s k ”Monetary Unit Sampling” (CMA sampling1). Strategin har två huvudsakliga kännetecken. Det första är att urvalet av poster görs med sannolikheter proportionella till posternas värden och det andra är att den statistiska inferensen, konfidensintervallen, baseras på Poissonfördelningen. Sålunda skall urvalet innehålla relativt sett fler poster med höga värden än med låga. Detta skulle kunna uppnås genom stratifiering efter värde, men vid CMA-urval uppnås effekten genom att göra chansen för en post att komma i urvalet direkt proportionell till värdet på posten. En post med värde 1.000 kronor skall följaktligen ha 100 gånger större chans att väljas än en med värde 10 kronor. Metoden att göra detta är ganska enkel. Alla poster i populationen listas och den kumulativa summan beräknas.

Om den totala summan är T(x) innebär ett slumpvis urval av tal mellan I och T(x) att varje post har en sannolikhet att komma med som står i direkt proportion till dess värde.

Cumulative montetary amount sampling

Exempel

Post	Värde	Kumulativ summa
1	10	10
2	10	20
3	10	30
4	20	50
5	20	70
6	30	100
7	40	140
8	50	190
9	70	260
10	80	340
11	200	540
12	320	860

Om ett slumpvis valt tal har värdet 75 faller det i intervallet ”större än 70 och mindre än eller lika med 100”. Alltså motsvarar detta post nummer 6. Denna posts sannolikhet att bli vald är 30/860.

Nyheten i CMA-urval ligger inte egentligen i metodiken att ta ut stickprovet utan i sättet att beräkna statistiska konfidensgränser och att värdera fel.

Först måste man definiera urvalsenheten, inte som varje post, t ex faktura etc, utan som varje enskild värdeenhet, krona. Följaktligen består en post med värde 1.000 kronor av 1.000 enkronorsenheter och det är utifrån dessa enheter stickprovet enligt ovan egentligen dras. Maximala felet i en penningenhet kan vara I. Den konventionella principen vid värdering är att värdera alla fel till dess möjliga maxivärde, i detta fall 1. Situationen blir alltså den att en felaktig enhet värderas till I, medan en icke felaktig värderas till 0, och det är just detta som kännetecknar en Poissonfördelning. Genom att identifiera felaktiga individuella penningenheter och koppla dessa till den post, i vilken de ingår, uppnås målet med stickprovet. Vi skall i detta sammanhang inte gå in på mer detaljer om metodiken utan hänvisar till andra källor.

Den huvudsakliga fördelen med CMA-urval är att det ger möjlighet att på ett relativt enkelt sätt ta ut ett stickprov och att dra slutsatser om värdet på fel i en population, då andra statistiska metoder inte kan användas.

Kritik har framförts mot metoden för att den skulle vara för dyr att genomföra. Listningen av posterna och de kumulativa summorna skall beräknas. Med tillgång till ADB-teknik torde dessa problem dock kunna lösas med hjälp av relativt små programmeringsinsatser.

Den huvudsakliga kritiken riktar sig emellertid mot definitionen av stickprovsenhet såsom penningenheter. Detta förutsätter, hävdar somliga, att posterna i populationen, fakturor, verifikationer m m är delbara i penningenheter. Men det är ej möjligt att i praktiken dela en faktura på 1.000 kronor i 100 st 10-kronorsfakturor. Konstruktionen görs dock av rent statistiska skäl och har ingen praktisk motsvarighet. Det är hela posten som är felaktig, inte den i posten ingående felaktiga enheten. En faktura på 1.000 kronor kan inte vara fel till 500 kronor medan resten är riktig utan hela fakturan är felaktig. Naturligtvis är den som använder sig av metoden medveten om detta och drar inga felaktiga slutsatser på grund härav.

Slutsatser

Sammanfattningsvis kan konstateras, att CMA-urval, ofta i kombination med clusterurval i många fall kan vara mycket användbara för revisionsändamål. Det finns dock inga enkla generella svar på de statistiska urvalsproblem som möter revisorn. Varje population har sina speciella egenskaper och stickprovets utformning skall spegla dessa egenskaper så bra som möjligt.

Flera revisorer i Sverige tycks nu anse att statistiska stickprov inte längre är lämpliga i revisionsarbetet. AICPA publicerar dock fortfarande bl a ”Field manual for statistical sampling”. Tekniken är således inte död. Inte ens i USA. Det kan dock antagas att det anses som omodernt av många revisorer att använda statistiska stickprov när man kan använda frågeschema- och flödesschema-teknik för att studera klienternas ”interna kontroll”. Statistiska stickprov är givetvis endast ett av många hjälpmedel i revisionsarbetet. Så har det varit även under den period på 50–60-talen när det praktiskt taget krävdes att en revisorsassistent skulle ha akademiska betyg i statistik för att få anställning på en revisionsbyrå. Dessa ibland rätt skrattretande överdrifter medförde att tekniken fick ett löjets skimmer över sig och den blev uttjatad och föll i glömska. Ingen lärare med ”självaktning” vill längre, t ex i FARs grundkurser, lära ut statistisk stickprovsteknik. Ändock används tekniken. Den har t o m utvecklats och anpassats än mer för de speciella krav som vi revisorer ställer på den. Det publiceras även nya läroböcker i ämnet utomlands.

Låt oss alltså inte glömma ett revisionsverktyg därför att det går mode i revision. Låt inte ”the new audit approach” förblinda. Det finns alltid en ny audit approach.

Litteraturanvisningar

TW McRae,: Statistical sampling for audit and control

TMF Smith: Statistical sampling for accountants

AICPA: Field manual for statistical sampling

Auktor revisor Erik Rydström och civilekonom Bernt Gyllenswärd

Post	Värde	Kumulativ summa
1	10	10
2	10	20
3	10	30
4	20	50
5	20	70
6	30	100
7	40	140
8	50	190
9	70	260
10	80	340
11	200	540
12	320	860

Post	Värde	Kumulativ summa
1	10	10
2	10	20
3	10	30
4	20	50
5	20	70
6	30	100
7	40	140
8	50	190
9	70	260
10	80	340
11	200	540
12	320	860