Maskinkod ( plattformsorienterad kod ), maskinspråk - ett system av kommandon (en uppsättning operationskoder) för en viss dator , som tolkas direkt av processorn eller firmware på denna dator. [ett]
Ett datorprogram skrivet på maskinspråk består av maskininstruktioner , som var och en representeras i maskinkod i form av en sk. opcode - den binära koden för en enda operation från maskinens kommandosystem. För programmeringsbekvämlighet , istället för numeriska opkoder , som bara förstås av processorn, används vanligtvis deras villkorliga alfabetiska mnemonics . En uppsättning sådana mnemonics, tillsammans med några ytterligare funktioner (till exempel vissa makron, direktiv ), kallas assemblerspråk .
Varje processormodell har sin egen instruktionsuppsättning, även om i många modeller dessa instruktionsuppsättningar överlappar kraftigt. Processor A sägs vara kompatibel med processor B om processor A helt "förstår" maskinkoden för processor B. Om processorerna A och B har någon delmängd av instruktioner för vilka de är ömsesidigt kompatibla, så sägs de vara av samma "arkitektur" (har samma instruktionsuppsättningsarkitektur ).
Varje maskininstruktion utför en specifik åtgärd, såsom en operation på data (till exempel lägga till eller kopiera ett maskinord i ett register eller i minnet ) eller hoppa till en annan kodbit (ändra exekveringsordningen; i detta fall, hoppa kan vara ovillkorligt eller villkorligt beroende på resultatet av tidigare instruktioner). Varje körbart program består av en sekvens av sådana atommaskiners operationer.
Operationer skrivna som en enskild maskininstruktion kan delas in i "enkla" ( elementära operationer ) och "komplexa". Dessutom består de flesta moderna processorer av separata "aktuatorer" - datorenheter som endast kan utföra en begränsad uppsättning enkla operationer. När nästa instruktion exekveras, översätter (avkodar) ett speciellt block av processorn - avkodaren - den till en sekvens av elementära operationer som förstås av specifika exekutiva enheter.
Arkitekturen för processorns instruktionsuppsättning avgör vilka operationer den kan utföra, och vilka maskininstruktioner som motsvarar vilka numeriska opkoder (opkoder). Opkoder har konstant längd (för RISC -, MISC -arkitekturer) och intervall (för CISC -arkitekturer; till exempel: för x86- arkitekturen har kommandot en längd på 8 till 120 bitar).
Moderna superskalära processorer kan utföra flera maskininstruktioner i en enda klockcykel .
Maskinkod kan ses som ett primitivt programmeringsspråk, eller som den lägsta representationen av kompilerade eller sammansatta datorprogram. Även om det är möjligt att skriva program direkt i maskinkod, görs detta numera sällan på grund av kodens krånglighet och mödan i att manuellt hantera processorresurser, förutom i situationer där extrem optimering krävs . Därför är de allra flesta program skrivna på högre nivåspråk och översatta till maskinkod av kompilatorer . Maskinkod hänvisas ibland till som infödd kod (även kallad inbyggd kod ) när man talar om plattformsspecifika delar av ett språk eller bibliotek . [2]
Program på tolkade språk (som Basic eller Python ) översätts inte till maskinkod; istället exekveras de antingen direkt av språktolken eller översätts till pseudokod ( bytecode ). Tolkarna av dessa språk (som själva kan ses som processorer) är dock generellt representerade i maskinkod.
I vissa datorarkitekturer tillhandahålls stöd för maskinkod av ett ännu lägre nivå av program som kallas firmware . Detta gör det möjligt att tillhandahålla ett enda maskinspråksgränssnitt för hela raden eller familjen av datorer, som kan ha betydande strukturella skillnader sinsemellan, och underlättar överföringen av program i maskinkod mellan olika datormodeller. Ett exempel på detta tillvägagångssätt är IBM System/360 -familjen av datorer och deras efterföljare: trots olika bussar från 8 till 64 bitar och högre delar de ändå en gemensam arkitektur på maskinspråksnivå.
Genom att använda ett lager av mikrokod för att implementera en emulator kan en dator representera arkitekturen hos en helt annan dator. I System/360-linjen användes detta för att porta program från tidigare IBM-maskiner till den nya familjen - till exempel IBM 1401/1440/1460-emulatorn på IBM S/360 modell 40.
Absolut kod ( engelska absolute code ) - programkod som lämpar sig för direkt exekvering av processorn [1] , det vill säga kod som inte kräver ytterligare bearbetning (till exempel lösa länkar mellan olika delar av koden eller bindning till adresser i minnet, vanligtvis utförs av programladdaren ). Exempel på absolut kod är körbara filer i .COM- format och en OS-laddare som finns i MBR . Ofta förstås absolut kod i en snävare mening som positionsberoende kod (det vill säga kod kopplad till specifika minnesadresser).
Positionsoberoende kod är ett program som kan placeras i vilket minnesområde som helst, eftersom alla referenser till minnesceller i det är relativa (till exempel i förhållande till programräknaren ). Ett sådant program kan när som helst flyttas till ett annat minnesområde, till skillnad från ett flyttbart program , som, även om det kan laddas till vilket minnesområde som helst, måste förbli på samma plats efter laddning. [ett]
Möjligheten att skapa positionsoberoende kod beror på målplattformens arkitektur och instruktionsuppsättning. Till exempel, om alla hoppinstruktioner i en instruktionsuppsättning måste ange absoluta adresser, så är kod som kräver hopp nästan omöjlig att göra positionsoberoende. I x86- arkitekturen representeras direktadressering i datainstruktioner endast av absoluta adresser, men eftersom dataadresser betraktas i förhållande till segmentregistret , som kan ändras när som helst, låter detta dig skapa positionsoberoende kod med ditt eget minne platser för data. Dessutom kan vissa instruktionsuppsättningsbegränsningar hävas med självmodifierande kod eller icke-triviala instruktionssekvenser.
Hej världen! » för en x86-processor ( MS DOS , utdata med BIOS -avbrott int 10h) är som följer (i hexadecimal notation ):
BB 11 01 B9 0D 00 B4 0E 8A 07 43 CD 10 E2 F9 CD 20 48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21Detta program fungerar när det placeras på offset 100 16 . Individuella instruktioner är markerade i färg:
Samma kod i assembler-kommandon :
XXXX:0100 mov bx, 0111h ; sätt in bx förskjutningen av HW-strängen XXXX:0103 mov cx, 000Dh ; lägg in cx längden på HW-strängen XXXX:0106 mov ah, 0Eh ; lägg in ah avbrottsfunktionen nummer 10h XXXX:0108 mov al, [bx] ; lägg in värdet på minnesplatsen vars adress är i bx XXXX:010A ink bx ; flytta till nästa byte i strängen (öka förskjuten med 1) XXXX:010B int 10h ; avbryta samtalet 10h XXXX:010D loop 0108 ; minska cx med 1 och om resultat≠0 hoppa till adress 0108 XXXX:010F int 20h ; avbryta 20h: avsluta programmet XXXX:0111 HW db 'Hej världen!' ; strängen som ska skrivas ut