Gene GM21_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3100
Symbol
ID	8138450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3590933
End bp	3591958
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	644870704
Product	PpiC-type peptidyl-prolyl cis-trans isomerase
Protein accession	YP_003022886
Protein GI	253701697
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0760] Parvulin-like peptidyl-prolyl isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	137
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTACC ATCACGCAGC ACCGAAGTCG CTTTTGGTTC TTTGTGCCGT CACCATGATG 
CTTTCAGGAT GCGCCGGCGC GAGGCCGACG GCTACCGCGC CGCCGGCGCC TGCGACGCCG 
CCGGCCGCCC AGGCCGCGCC GGCCGCCGCC GGCGAGGTGG TCGCCAGGGT GAACGGCAAG 
GAGATTCACC GAAACGAGCT GGAGCGGAGC AAGAAGATCC TGATGGCCGG ACAGCCGGGG 
ATCCCCCCCT ATCTGCTGAA GGAGCTGGAA AAGCAGGCCC TGGATCAGCT GGTCGGCGCG 
GAACTCATGT ACCAGGCGGG CCTCGGGCTG CAGATCAAGG ACCTGGACCG GATGGCGGAC 
GCGAAGCTCG TCCAGATAAA GTCGGGTTTC AAGGATCAGC AGGTGTACGA AAAGGAGCTG 
GCCAACATCG GCATGACCGA GCAGATGCTG CGGGAGTACT CGCGGCGCGA CCTGGTGATC 
GCGAACCTGG TCAACACCAA GCTCGCCGCC GACCTGCAGG TCACCGATCT GGAGATCGAG 
AAGTTCTATG CCGACAACCC GGAACGGTTC GAGCAAAAGG AGCAGGTCAG GGCGAGCCAT 
ATCCTGATCG GCTGCGACTC GAAGGGCACC GCCGAGGAGA AGAAGAAGGC CCGGGACAAG 
GCTGAGAGGC TCCTCAAGGA GGTGAAGGAG GGGGCTGACT TCGCGAAGCT TGCCCGTGAA 
AACTCCACCT GCCCGAGCGC CACCAACGGC GGCGACCTCG GTTACTTCCC CAGGGGAAAG 
ATGGTTCCCC CCTTCGAAGA GGCCGCTTTC GCCTTGAAAA GCGGAGAGGT GAGCGACGTG 
GTGGAGACCG GCTTCGGCTT CCACCTGGTG AAGCAGACCG ACCGCATCAA GGCTGAAAAG 
GTCTCGCTCG CCACGGCCAG GGAGAAGATC GTCGCCTACC TGAAGAGCCA GAAGACGGGC 
GAGGTGGTTG CTTCGTTCAT CGGCCGCGCC AAGCAGGATG CGAAGATCGA ACTGCTCTTG 
AAGTAA

Protein sequence

MHYHHAAPKS LLVLCAVTMM LSGCAGARPT ATAPPAPATP PAAQAAPAAA GEVVARVNGK 
EIHRNELERS KKILMAGQPG IPPYLLKELE KQALDQLVGA ELMYQAGLGL QIKDLDRMAD 
AKLVQIKSGF KDQQVYEKEL ANIGMTEQML REYSRRDLVI ANLVNTKLAA DLQVTDLEIE 
KFYADNPERF EQKEQVRASH ILIGCDSKGT AEEKKKARDK AERLLKEVKE GADFAKLARE 
NSTCPSATNG GDLGYFPRGK MVPPFEEAAF ALKSGEVSDV VETGFGFHLV KQTDRIKAEK 
VSLATAREKI VAYLKSQKTG EVVASFIGRA KQDAKIELLL K