Per Flöstrand och Jan-Erik Gröjer: Vem klarar revisorsprovet?

Jacobsson, P. & Johansson, H. & Persson, M. (2004) Prov för revisorsexamen – en studie av faktorer som påverkar provprestation, Magisteruppsats, Företagsekonomiska institutionen, Uppsala Universitet

Först av allt vill vi deklarera att till grund för den här artikeln ligger en magisteruppsats vid Uppsala universitet förtjänstfullt skriven av Petra Jacobsson, Helena Johansson och Mathias Person1. De ansåg sig dock inte ha någon möjlighet att tillsammans skriva en artikel och överlät därför på oss att fullfölja det arbetet. Vi har dock valt att bearbeta grunddata på lite annorlunda sätt än i uppsatsen. Dessutom har vi kompletterat några tabeller med data från det senaste provet, november 2003.

Bakgrunden till uppsatsen var att examensrådet vid Revisorsnämnden gärna såg att någon ”tittade lite närmare” på provverksamheten som ett led i den egna kvalitetssäkringen av provet. En fråga som diskuterats är om de som klarar provet (vid första tillfället) har några gemensamma egenskaper i form av t.ex. kön eller erfarenhet. Även själva proven skulle kunna analyseras med avseende på förmågan att mäta det de är avsedda att mäta; ”professionellt omdöme”. Det sistnämnda är dock en komplicerad utvärdering som får vänta på en ny uppsatsgrupp! Provet för högre revisorsexamen har ännu inte tillräckligt många skrivit för att analysen skall bli meningsfull. Förhoppningsvis kan vi återkomma till det om ca ett år.

Är frekvensen godkända rimlig?

I november 2002 (Nov02) genomförde 206 personer provet för revisorsexamen, i maj 2003 (Maj03) var det 140 personer och i november 2003 (Nov03) var det 234 personer, totalt 580 observationer.

Den genomsnittliga andelen godkända för de tre proven är 48%.

	Andel godkända	Antal provdeltagare
Nov 02	64 %	206
Maj 03	33 %	140
Nov 03	42 %	234
Totalt	48 %	580

Det är både förvånande och oroande med den stora spridningen i andelen godkända mellan provtillfällena. Det ligger nära till hands att tro att provet Nov02 var ”något lättare”. Eftersom en stor andel av de icke godkända ligger i intervallet 70–75 poäng, räcker det med någon poängs förskjutning för att andelen godkända kraftigt skall förändras.

Med en fast gräns på 75 poäng av 100 för godkänt, kommer andelen godkända alltid att variera. Det går inte att åstadkomma prov med identisk svårighetsgrad samt rättning med identisk bedömningsnorm, även om det självfallet bör vara ambitionen. Alternativet är att anta att provdeltagarna som grupp är lika kompetenta och därför samma andel bör godkännas vid varje provtillfälle. Som en konsekvens måste då gränsen för godkänt ständigt justeras. Ett sådant förfarande är inte helt smakligt. Det innebär att frångå en tro på att det går att hjälpligt bedöma nödvändigt professionellt omdöme. Dessutom kräver ett andelstänkande en subtil politisk process där andelen godkända skall fastställas, en slags professionell kvotering.

Vårt svar på rubrikens fråga om frekvensen godkända är rimlig blir då jakande, även om svaret inte är oproblematiskt. Under alla omständigheter bör både frågan och tänkbara svar debatteras, inte minst i ett internationellt perspektiv.

Är proven könsneutrala?

Det föreligger stora skillnader i godkännandefrekvens mellan kvinnor och män. Av kvinnorna är det i genomsnitt 44 % (115 av 264) som klarat provet mot 51 % (161 av 316) för män.

Andel godkända
	Kvinnor	Män
	%	(antal)	%	(antal)
Nov 02	60 %	(54)	67 %	(78)
Maj 03	28 %	(18)	37 %	(28)
Nov 03	39 %	(43)	44 %	(55)
Totalt	44 %	(115)	51 %	(161)

Vi ser att vid varje provtillfälle har kvinnor klarat provet sämre än män. Vad kan nu de relativt stora könsskillnaderna tänkas bero på? Är proven inte könsneutrala? Kanske är inte rättningen det?

Eller är det helt andra orsaker som ligger bakom könsskillnaderna?

En första kontroll är att studera om det finns några skillnader mellan revisionsbyråerna, dvs. är det ett byråproblem snarare än ett provproblem (eller möjligen båda)? Här har de två provtillfällena Nov02 och Maj03 slagits samman för att få fler observationer. De jämförs sedan med provet Nov03 för att se om tendensen är densamma. (Det första talet inom parentes anger antal godkända och det andra antalet provdeltagare.)

Andel godkända
	Kvinnor	Män
	%	(antal)	%	(antal)
Deloitte	26 %	(6/23)	50 %	(12/24)
E&Y	68 %	(20/29)	60 %	(25/42)
KPMG	60 %	(15/25)	61 %	(11/18)
ÖPWC	39 %	(21/54)	55 %	(36/66)
Övriga	42 %	(10/24)	54 %	(22/41)
Totalt	46 %		55 %

Ovanstående sammanställning pekar på att könsskillnaderna i godkännandefrekvens under alla omständigheter är mer ett revisionsbyråproblem än ett provproblem. Det finns ett stort antal tänkbara förhållanden som kan förklara, om än ej ursäkta, skillnaderna mellan å ena sidan Ernst &Young och KPMG och å andra sidan Deloitte och Öhrlings Price-waterhouseCoopers.

Bilden från det senaste provet, Nov03, är dock delvis en annan.

Andel godkända
	Kvinnor	Män
	%	(antal)	%	(antal)
Deloitte	54 %	(7/13)	31 %	(5/16)
E&Y	52 %	(14/27)	43 %	(9/21)
KPMG	47 %	(7/15)	63 %	(10/16)
ÖPWC	42 %	(8/19)	30 %	(10/33)
Övriga	20 %	(7/35)	57 %	(21/37)
Totalt	39 %		44 %

Nu klarar kvinnorna proven bättre i tre av de fyra stora byråerna. Det ytterst svaga resultatet för kvinnor från övriga byråer förklaras helt av de mycket små byråerna. En möjlig delförklaring till det relativt sett förbättrade resultatet för kvinnor är om en större andel kvinnor nu gör provet för andra och tredje gången. Vi har dock inte haft möjlighet att kontrollera för detta.

Även om nu bilden blivit mer svårtolkad, kan en förklaring vara att kvinnor i vissa byråer får göra provet utan tillräckliga erfarenheter därför att det sker för tidigt i karriären. Eller så är möjligheterna att få nödvändiga erfarenheter för kvinnor sämre, dvs. internutbildningen brister. Det är förklaringar som kan vara giltiga för skillnaderna mellan revisionsbyråerna när även män inkluderas. Det finns dock ingen möjlighet att i den här typen av studier att med säkerhet tala om orsaker till resultaten. Det måste vara en fråga för berörda parter att undersöka vidare.

Är verksamhetsort av betydelse?

Vi har vid flera tillfällen fått höra att en orsak till den stora andelen underkända skulle vara att revisorer på de stora kontoren specialiserar sig väldigt tidigt. Därför möter de inte alla de problemsituationer som skall bedömas i proven.

Vi slår här ihop materialet från de två provtillfällena Nov02 och Maj03. Vi delar därefter upp det på Stor-Stockholm (Stor-S) och övriga landet (Övr. landet). Här använder vi antalet erhållna poäng som ett mer precist mått på provresultat än antalet godkända/underkända.

Genomsnittligt antal poäng
	Stor-S.	Övr. landet
Deloitte	68	71
E&Y	72	74
KPMG	72	75
ÖPWC	68	73
Övriga byråer	70	72

Resultatmönstret är tydligt och informativt. För alla byråer är genomsnittspoängen för revisorer verksamma i Stor-Stockholm 2–5 poäng lägre än för revisorer från andra orter. Och det är poängskillnader som betyder mycket för andelen godkända.

Här har vi, liksom ovan, slagit ihop de medelstora och små revisionsbyråerna därför att antalet observationer är relativt litet. Utan att närmare gå in på siffror har provdeltagare från de medelstora byråerna bättre resultat än provdeltagare från de små.

Återigen saknar vi data som kan styrka något slags orsakssamband. Men logiken är klar: givet att provet testar det professionella omdömet, visar provdeltagare från Stor-Stockholmskontoren sämre professionellt omdöme.

Är tidigare provförsök av betydelse?

Det är vanligt att det finns en inlärningseffekt av prov, dvs. en provdeltagare gör ett bättre prov andra gången med i övrigt oförändrade kunskaper. Det finns en räcka förklaringar till att det kan förhålla sig på det sättet, något som dock ligger utanför den här artikeln.

Sammanställer vi materialet för provdeltagare som skriver för första, andra och tredje gången, erhåller vi följande resultat.

	Andel godkända	Antal
1:a gången	50 %	(263)
2:a gången	54 %	(67)
3:e gången	83 %	(12)

Vi ser här att det föreligger ett relativt entydigt resultat, även om antalet observationer är ytterst litet för den 3:e gången. Däremot kan vi inte säga om detta mönster beror på provinlärning eller bättre förberedelser. Under alla omständigheter tolkar vi utfallet som naturligt.

Betydelsen av individuella skillnader?

Det är bara fantasin som sätter gränser för vilka individuella bakgrundvariabler som kan tänkas förklara provresultatet. Vi har redan granskat betydelsen av kön. Men data finns bl.a. också om ålder och yrkesmässig erfarenhet.

Av dem som är yngre än 30 år blev sammanlagt 59 % godkända vid de två proven Nov02 och Maj03, mot 46 % för dem som var 30 år och äldre. Vi överlåter till läsaren att spekulera. Ålder är ju inte så mycket vi kan göra åt!

Spelar då inte yrkesmässig erfarenhet någon roll? Absolut! Av dem som hade mindre ån 5 års yrkeserfarenhet var andelen godkända 48 %, för de med mer än 5 år 65 %. Hur går då detta ihop med ålder? Vi fann i materialet 16 provdeltagare som var yngre än 30 år, men hade mer än fem års yrkesmässig erfarenhet. Av dem så blev 13 godkända, dvs. 81 %. Vi skall dock inte dra alltför långtgående slutsatser pga. det begränsade antalet observationer. Men intuitivt pekar det åt ett rimligt håll, dvs. på en snabb och effektiv karriär som revisor.

Slutsatser

Vilka slutsatser kan vi då dra av redovisade data? Efter det att vi genomfört ett antal analyser, lagt samman tabeller och försökt tolka statistiken framstår ändå en faktor som mest betydelsefull för provresultatet: erfarenhet.

Någon skulle kunna påstå att den slutsatsen utgör ett ogrundat glädjetänkande av provansvariga. Men den relativt låga andelen godkända, skillnaderna mellan byråerna, mellan kvinnor och män i ett par byråer, mellan revisorer verksamma i Stor-Stockholm och övriga landet m.m. kan hänföras till en minsta gemensam nämnare; erfarenhet eller, tyvärr alltför ofta, brist på densamma.

Förhoppningsvis kan den här artikeln vara en liten pusselbit till en mer adekvat interutbildning av revisorer. Den kan sedan ta sig formen av mer högkvalitativa kafferumsdiskussioner eller av interna eller av irev arrangerade kurser, seminarier och provtentamina för att träna det professionella omdömet i situationer när svaret sällan är givet.

Det ligger utanför vår bedömning om den här analysen kommer att påverka arbetet i examensrådet vid Revisorsnämnden. Det är kanske viktigare för examensrådet att undersöka om proven verkligen mäter det de är tänkta att mäta: det professionella omdömet. Det kan också vara angeläget att försöka systematiskt jämföra Revisorsnämndens prov med motsvarande prov i andra länder.

Genom att kritiskt granska provverksamheten skapar vi förutsättningar för att höja kvaliteten genom debatt, självrannsakan och handling. Det torde gälla alla berörda parter, från universitet till revisionsbyrå.

Per Flöstrand

är doktorand vid Företagsekonomiska Institutionen, Uppsala Universitet. Han är Svenska Revisionsakademins stipendiat finansierad av Ernst & Young.

Jan-Erik Gröjer

är professor i redovisning och finansiering vid Företagsekonomiska Institutionen, Uppsala Universitet och ordförande i Svenska Revisionsakademin.