Gene GM21_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1080
Symbol
ID	8136402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	1266574
End bp	1267557
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	67%
IMG OID	644868691
Product	UDP-N-acetylenolpyruvoylglucosamine reductase
Protein accession	YP_003020899
Protein GI	253699710
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0812] UDP-N-acetylmuramate dehydrogenase
TIGRFAM ID	[TIGR00179] UDP-N-acetylenolpyruvoylglucosamine reductase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	2.21619e-24
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCATCG ACCAGGCAAA AGAAAACCAG CAGATAGAGC TCTTGCGGGA CGTCCCCCTC 
GCCCCCTTCA CCTCGTTCAA GATCGGCGGC CCGGCCAGGT TCTTGACCAT GGCCCGGACG 
CTGGAACAAC TGAAGCAGGC GCTTTCCTTC GCCAGGCGGG AAGGGATTCC CTTCCTCATC 
GTCGGGGGGG GATCCAACCT GCTGGTGAGC GACCGCGGTT TCGACGGCAT CGCGATCAGG 
CTGCAGCTGA AAGGGATCAA GGTCCAAGGG AACCGGGTCG AGGCGCAGGC GGGAGTCGAC 
CTCATGGCGC TGGTGGAGCA TGCGGCACAC TGGGGGCTGG CGGGGATCGA GCGGCTGGCT 
GGCATTCCGG GGCTCTTCGG GGGGGCGGTG CGCGGCAATG CGGGGGCCTA CGGCAGTTGC 
ATCGGCGACG TGATCGAGAG GGTCTACGCG CTCCGGACGG AGACCATGGA GCTGGTCGCG 
CTCACGCGGG ACGACTGCCG GTTCCAGTAC CGCGACAGCC GTTTCAAGAA GGATCACGGG 
CTGGTGGTGG TGGCGGCGAG CCTGCTGCTT GAGCCGGCGG ACCCCCAGGA GATCCTGCGC 
CAGGCCGAGG CGACGGTGAG GAAACGGCAA GCCCGCCGGC TGCAATGCGA CCGGAGCGCC 
GGCTCTTTCT TCATGAATCC GGTGGTGCGC GACCCAGAGC TGATCCGGAG GTTCGAAACC 
GAGCAGGGAA CCCACTGCAG GGACGGCAGG ATTCCCGCCG GATGGCTCAT CGACAAGGCC 
AGGCTGCGCA GCCTCGCGGT GGGTGCGGCC ATGGTCAGCC CACGGCACGC CAATTACCTG 
ATCAACACCG GCAACGCCAG CGCCCAGGAG GTGGTGAGGC TCGCCGAGCT GGTGAAGGAC 
GAGGTGCGGG CGTCGCTGGG GGTGCAGTTG GAGGAGGAGG TGAGCTGCGT CGGCTTCACT 
CAGGCTGCGC CGCTTCCCTC CTGA

Protein sequence

MFIDQAKENQ QIELLRDVPL APFTSFKIGG PARFLTMART LEQLKQALSF ARREGIPFLI 
VGGGSNLLVS DRGFDGIAIR LQLKGIKVQG NRVEAQAGVD LMALVEHAAH WGLAGIERLA 
GIPGLFGGAV RGNAGAYGSC IGDVIERVYA LRTETMELVA LTRDDCRFQY RDSRFKKDHG 
LVVVAASLLL EPADPQEILR QAEATVRKRQ ARRLQCDRSA GSFFMNPVVR DPELIRRFET 
EQGTHCRDGR IPAGWLIDKA RLRSLAVGAA MVSPRHANYL INTGNASAQE VVRLAELVKD 
EVRASLGVQL EEEVSCVGFT QAAPLPS