Gene GM21_1936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1936
Symbol
ID	8137270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2246922
End bp	2248274
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	61%
IMG OID	644869550
Product	nucleotide sugar dehydrogenase
Protein accession	YP_003021747
Protein GI	253700558
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	104
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAT GTGTGGTCGG ATCAGGCTAC GTGGGTCTCG TAGCCGGCAC CTGTTTTGCC 
GAAAGCGGTA ACGACGTCAT CTGTGTCGAC GTCGACAAGG ACAAGATAGA CGGTCTGAAG 
CGCGGCGTCA TTCCCATCTA CGAGCCCGGC CTGAAGGAAA TGGTCTTAAG GAACTGCGAG 
GAGGGGAGGC TCAACTTCAC CACCGACCTC GACCTGGCCG TCAAGGAGTC GCTGGTTTGC 
TTCATCGCGG TCGGCACCCC CCCCGGCGCC GACGGCTCCG CCGACCTGCA GTACGTCCTC 
TCCGTCGCCC GCTCCATCGG CCGCGCCATG GAGAGCTTCA AGATCATCGT CGACAAGTCC 
ACCGTCCCGG TCGGGACAGC CGACAAGGTG CGCGCCGCCG TGAACGAGGA GCTCGCCAAG 
CGCGGGACGC ATATAGAATT CGACGTGGTG TCCAACCCCG AGTTTTTAAA GGAAGGGGCC 
GCCATCGACG ACTTCATGAA ACCCGACCGC GTCGTCATCG GTACCGACAA CGTGAGGACC 
GCCGAGATTA TGAAGGAGCT CTACTCGGCC TTCATGCGCA AGTCCAACCG CCTGCTGGTG 
ATGGACATCA GAAGCGCCGA GATGACCAAG TACGCCGCCA ACGCCATGCT CGCCACCCGC 
ATCACGTTCA TGAACCAGAT CGCGAACCTC TGCGAGATGG TGGGCGCGGA CGTCATGGCG 
GTTCGGGAGG GGATCGGCTC CGACTCCCGC ATCGGTTACG ACTTCCTCTT CCCCGGCGTC 
GGCTACGGCG GCTCCTGCTT CCCCAAGGAC GTCAAGGCCC TGGTGAAGAC GGCGGACGAG 
TGCAGCTACG ACTTCGTCCT TTTGAAGGCG GTGGAGACCG CCAATGAACG GCAAAAGGCG 
ATCCTCTCCG ACAAGATACT GCGCCGTCTG GGAAGCGCAG GCGACAAGCC TCTGGCCGGC 
AAGCGCTTCG CCATCTGGGG ATTGTCCTTC AAGCCCCGCA CCGACGACAT GAGAGACGCC 
CCTTCGCTCA CCATCATCAA CAGGCTTTTG GAAATGGGAG CGAGCGTGCA CGCCCACGAC 
CCCGAGGCGA TGAACGAGGC GAAGAAGCAT TTCGGCGACC GCATCAGCTA CAGCGTGAAC 
AAGTACGACC TGATGAGAGG GGCCGATGCG CTCGTCGTCA TCACCGAGTG GAACGAGTAC 
AGGAACCCCG ATTTCGACCG CATCAAGGAG CTCCTGATCA ACCCGATCAT CTTCGACGGC 
CGGAACCTCT ACCACCCTGG CCGCATGAAG GAGGCCGGGT TCGAGTACCT CCCCATCGGC 
CGAAACGGCG AGGCCGTCTG CGAAATGGAC TAA

Protein sequence

MKVCVVGSGY VGLVAGTCFA ESGNDVICVD VDKDKIDGLK RGVIPIYEPG LKEMVLRNCE 
EGRLNFTTDL DLAVKESLVC FIAVGTPPGA DGSADLQYVL SVARSIGRAM ESFKIIVDKS 
TVPVGTADKV RAAVNEELAK RGTHIEFDVV SNPEFLKEGA AIDDFMKPDR VVIGTDNVRT 
AEIMKELYSA FMRKSNRLLV MDIRSAEMTK YAANAMLATR ITFMNQIANL CEMVGADVMA 
VREGIGSDSR IGYDFLFPGV GYGGSCFPKD VKALVKTADE CSYDFVLLKA VETANERQKA 
ILSDKILRRL GSAGDKPLAG KRFAIWGLSF KPRTDDMRDA PSLTIINRLL EMGASVHAHD 
PEAMNEAKKH FGDRISYSVN KYDLMRGADA LVVITEWNEY RNPDFDRIKE LLINPIIFDG 
RNLYHPGRMK EAGFEYLPIG RNGEAVCEMD