Gene Ssol_2452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2452
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2256498
End bp	2258039
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	38%
IMG OID
Product	Hydantoinase/oxoprolinase
Protein accession	ACX92601
Protein GI	261602998
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.79439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGAATTA GAATAGGTAT TGATATTGGT AGTACTCATA CAGATGCAGT AGCATTAGAA 
GGTAAAGAGC TAATAGTAGC TGACAAAGTA ATGACTACAC CAGACCTAAC TACTGGACTT 
TTAAATGCCA TAAGTAGAGT GATGAAAAAG CTTGGAGAAA GGAAAAACGA AGTAGATACG 
CTAATGATAG GAACTACTCA CGGTCTGAAC GCCTTACACC AGGGTAAAGG CTTAAATAGA 
GTAGCGACCA TTAGAATTGG CTTACCTGCA GGAGAGGGAG TTCCTCCAGT ATTTGACTGG 
CCAGAGCAGT TATCAAACTT TGTCACCTAT AGATATATGG TAAGAGGAGG CCATGAATAT 
ACCGGGGAAG AAATAGTGGA GTTAGATGAG GGCAAAATAA AGGAGATTGC TGAAGCCATA 
AATGGTAAAG TTGATGCCAT AGCTATTAGT TCAATATTTT CAGTTGTAAA TTCGTCACAT 
GAGATTAGAG CGAGGGAGAT TTTAAGAGAG AAAGGAATTA ATGTGCCTAT AGTACTTTCT 
CACGAAATTG GTGGAATAGG ACTGTTAGAG AGGGAGAACT CAGCGATCCT AAATGCGTTA 
ATACTTAAAA TCTTCGATAA CTTAATAAGC AAAATCAAAC AGTTACTTTC TTCTTTAGGT 
ATAGAAGATG TGAGACTATT CTTTGCACAG AATGATGGGA CTGTGGCCTC TGAAGATTTC 
ATCAAAAGCT ATCCAATATT CACTGTAGCT GGACCAGTTT CAAATAGTAT TAGAGGAGCG 
CATTTACTGA CTGGGATAAA AGATGCAATA GTAATGGATG TAGGAGGGAC TACAACAAAT 
GTGGGTGTTC TCCATGAGGG ATATCCTAGA GAATCCTCAT CTGTAGTAGA AATAGCCAAA 
ATAAGGACTA ATTTTAGAAT GCCCGACATT TATACGATGG CATTGGGAGG AGGCACCATA 
GTTAATAAGG AGAAAATAGG ACCAGAGAGT GTGGGTTACG CACTGATAAA TAAGGGAATA 
TCATGGGGAG GTGATACTTT AACCGCAACA GATGTAGCTA TGATAGTGAA AGGAATAACA 
ATAGATGGTA CAAATCCGAA GCTAGTAAAC AACAAATTCC CTATGGAGTA CTTATTTAGC 
GCATACACTA AAATGGTGGA AATGTGGGAA GACGCCATAG ACTTAATGAA AACTTCAAAG 
GATGACGTAA CGGTAATTGT TGTGGGTGGG GGAAGTATAA TGGTCCCAGA GAAGCTAAAA 
GGTGCGATGG AAGTTATAAG GCCACGAAAT GCCCAATACG CTAATGCCAT AGGTGCGACA 
TTAACTAAAG TTGGTGCAAC GATAGAAAGG ACATTCTCTT ATGATCAAAT AACTAGGGAA 
AATGCAATAA AGAGTCTAAT TAATGAGGCT AAAAGTTTAG CCATAAGAGC TGGGGCCTTA 
AATACAACGA TAGAAGTTAG AGAAATAGAA GAAATACAAA TACCTTATCT ACCTGGAAAT 
TCAGTGAAAG TAAAAGTTAA GGTAGTTGGT GAATTTTCTT AA

Protein sequence

MRIRIGIDIG STHTDAVALE GKELIVADKV MTTPDLTTGL LNAISRVMKK LGERKNEVDT 
LMIGTTHGLN ALHQGKGLNR VATIRIGLPA GEGVPPVFDW PEQLSNFVTY RYMVRGGHEY 
TGEEIVELDE GKIKEIAEAI NGKVDAIAIS SIFSVVNSSH EIRAREILRE KGINVPIVLS 
HEIGGIGLLE RENSAILNAL ILKIFDNLIS KIKQLLSSLG IEDVRLFFAQ NDGTVASEDF 
IKSYPIFTVA GPVSNSIRGA HLLTGIKDAI VMDVGGTTTN VGVLHEGYPR ESSSVVEIAK 
IRTNFRMPDI YTMALGGGTI VNKEKIGPES VGYALINKGI SWGGDTLTAT DVAMIVKGIT 
IDGTNPKLVN NKFPMEYLFS AYTKMVEMWE DAIDLMKTSK DDVTVIVVGG GSIMVPEKLK 
GAMEVIRPRN AQYANAIGAT LTKVGATIER TFSYDQITRE NAIKSLINEA KSLAIRAGAL 
NTTIEVREIE EIQIPYLPGN SVKVKVKVVG EFS