Gene GM21_3873 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3873
Symbol
ID	8139247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4459301
End bp	4460743
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	64%
IMG OID	644871490
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_003023648
Protein GI	253702459
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATGA AGAAACAGGA AGCGTATTTG AAGGAGTGGC AGGGGCACGA GGAGCTCGCG 
GAACAGATGC TCCCCATCAT CGGTCGCTTG TACCGTGACC ACAACATCGT GACCACCGTG 
TACGGCAGGT CGCTGGTCAA CAGCCCGACC ATCGAGATCC TCAAGGCGCA CCGGTTCGCC 
CGTCTGATCC TCGACGGCGA ACTGACCGTC CAGGACACTT TCCCCATTCT CGAAGCCATC 
GGCAAGATGG ACCTCGCTCC GGCCCGCATC GACCTGGGAA GGTTGGCGGT CCGCTACCAG 
TCGCAGCAGG GAAGCTCGGT CGCCGACTTT GTGAGCCGCG AACTCGCCTC CGTCAACACC 
GGCCGCACGC CGCTTCTGGA CGAGCCGCAG GACATCGTGC TGTACGGCTT CGGCCGCATC 
GGTCGCCTGG TGGCCCGCAT CCTGGTCGAG AAGTCCGGCT CCGGCGAGAA GCTCAGGCTG 
CGCGCGGCGG TGGTCCGCAA GGGCGGCCCG GACGACCTGG TGAAAAGGGC GAGCCTTTTG 
CGCCGCGACT CGGTGCACGG ACCCTTCAAC GGGATCATCA CCATCGACGA GGAAGAAAAC 
GCGATCATCG CCAACGGCAA CATGATCCGC ATCATCTACG CCGACGCGCC GGAGAACGTG 
GACTACGCGC AGTACGGCAT CCGTAACGCG ATCGTGATCG ACAACACCGG CAAGTGGCGC 
GACCGCGAAG GGCTTGGGCG TCACCTGAAG GCATCGGGAG TGAGCCAGGT CGTGCTCACC 
GCCCCGGGCA AAGGGGACAT CCCCAACGTC GTCTTCGGCG TCAACAACGA ACTCATCGCC 
TCCACCGAGA GCATCTTCTC CGCGGCGAGC TGCACCACCA ACGCCATCGT GCCGGTTTTG 
AAGGCGGTGA GCGACAACTT CGGTATCGTG AGCGGCCACG TGGAAACCTG CCACTCCTAC 
ACGAACGACC AGAACCTGAT CGACAACTAC CACAAGGCGG ACCGCCGTGG GCGGAGCGCC 
CCGTTGAACA TGGTCATCAC CGAGACCGGC GCCGCCAAGG CCGTCGCCAA GGTGCTTCCG 
GAGCTGACCG GAAAGCTGAC CGGCAACGCC ATCCGTGTAC CGACACCGAA CGTCTCGCTG 
GCGATCCTGA ACCTGCAGCT CAAGTCGGAG ACCGACGTCG CGACGCTGAA CGGCTACCTG 
CGCGCCATGT CGCTCGACTC GCCGCTGCAG AACCAGATCG ACTACACCAA CTCCCCGGAC 
GTGGTCTCCA GCGACATGGT CGGTTCGCGC CACGCCGGCG TGGTCGACTC TCTCGCCACC 
ATCGTTCAGG GCAACCGTTG CGTCCTTTAC GTCTGGTACG ACAACGAGTT CGGCTACAGC 
TGCCAGGTAG TGCGCATGGT GCAGAAGATG GCAGGCCTGG AACTCCCGAT GCTGCCGGCG 
TAA

Protein sequence

MIMKKQEAYL KEWQGHEELA EQMLPIIGRL YRDHNIVTTV YGRSLVNSPT IEILKAHRFA 
RLILDGELTV QDTFPILEAI GKMDLAPARI DLGRLAVRYQ SQQGSSVADF VSRELASVNT 
GRTPLLDEPQ DIVLYGFGRI GRLVARILVE KSGSGEKLRL RAAVVRKGGP DDLVKRASLL 
RRDSVHGPFN GIITIDEEEN AIIANGNMIR IIYADAPENV DYAQYGIRNA IVIDNTGKWR 
DREGLGRHLK ASGVSQVVLT APGKGDIPNV VFGVNNELIA STESIFSAAS CTTNAIVPVL 
KAVSDNFGIV SGHVETCHSY TNDQNLIDNY HKADRRGRSA PLNMVITETG AAKAVAKVLP 
ELTGKLTGNA IRVPTPNVSL AILNLQLKSE TDVATLNGYL RAMSLDSPLQ NQIDYTNSPD 
VVSSDMVGSR HAGVVDSLAT IVQGNRCVLY VWYDNEFGYS CQVVRMVQKM AGLELPMLPA