PSI Protein Classifier är ett datorprogram som låter dig sammanfatta resultaten av både på varandra följande och oberoende iterationer av PSI-BLAST- programmet . Programmet avgör om de proteiner som hittas av blast tillhör tidigare kända familjer och delar in de återstående proteinerna i grupper. Det gör det möjligt att kvantifiera (med antalet iterationer) nivån av samband mellan olika familjer av homologa proteiner .
PSI Protein Classifier använder filer som genererats från NCBI -webbplatsen av PSI-BLAST-programmet. När du börjar screena en databas med aminosyrasekvenser med PSI-BLAST måste du ange proteinsekvensen som används som en fråga i FASTA -format och tilldela den ett binärt namn separerat med ett bindestreck. I detta fall måste den första delen av namnet vara beteckningen på den familj som det tillhör. Det är nödvändigt att sekventiellt (efter varje iteration) spara, med hjälp av läget "Använd gamla BLAST-rapportformat", webbsidor med resultaten av PSI-BLAST-programmet som textfiler (.txt) i PSI-Blast-mappen (dessa filer kallas "blast-filer").
PSI Protein Classifier använder filer med familjelistor som hjälpfiler. Förekomsten av sådana filer är valfri. Filer av denna typ är textfiler (.txt) och placeras i mappen FamilyName (dessa filer kallas "familjefiler"). Den första raden i var och en av dessa filer är namnet på familjen, föregås av två valfria ord och följt av minst ett till. Följande rader indikerar antalet proteiner (GenPept-accessionsnummer) som tillhör denna familj - en per rad. Det är viktigt att varje nummer innehåller en indikation på proteinversionen, det vill säga den sista siffran i numret föregås av en punkt. Programmet kan också använda färdiga listor över familjer från CAZy-databasen , sparade som textfiler (.txt), som familjefiler . Det bör noteras att CAZy-databasen täcker familjerna av glykosylhydrolaser och ett antal andra enzymer som verkar på kolhydrater och deras derivat.