Gene Daro_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0220
Symbol
ID	3569612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	240702
End bp	242060
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	60%
IMG OID	637678658
Product	glucosamine-1-phosphate N-acetyltransferase / UDP-N-acetylglucosamine pyrophosphorylase
Protein accession	YP_283449
Protein GI	71905862
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	0.600609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCG TTATTCTCGC TGCCGGTCAA GGCAAGCGCA TGCATTCCAA CCTCCCCAAA 
GTGTTGCATC CGATCGCTGG CAAGCCGCTG GCCCAGCATG TGATCGATAC GGCGCGCCAG 
TTGTCACCGG AAAAGCTGAT TGTGGTCTAT GGTCATGGCG GCGAAGTGGT TCGCTCCACG 
CTGGCTGCCC CTGATCTTTC CTGGGCCGAG CAGGCACAGC AACTGGGCAC CGGCCATGCG 
GTGGCGCAGG CCTTGTCCGA ATTGGGTAGT GCCGCCCAGA CGCTGGTACT TTACGGCGAT 
GTGCCGTTGA CCACGGTGGC GACACTGAAA CGTCTGCTGC AGGCAGGCAA GGATGCCTTG 
TCGGTGCTGA CCGTCGATCT TGCCAATCCG AGCGGCTATG GCCGTATCGT GCGCGATGGC 
GCCGGCAACA TGATCAGCAT CGTCGAGGAA AAGGATGCGA GTGCCGAGCA GAAGGCGATT 
CGAGAAGTGA ACACCGGGAT CATGGCCGTG CCGACGGCCC GTCTCGCCGA CTGGTTGGGC 
AAGTTGAAGA ATGACAATGC GCAGGGCGAG TATTACCTGA CCGACATCAT CGCGCTGGCG 
GTGGCCGAGG GCATGCCTGT GCGCACGGCG CAGCCGGAGG GCGAATGGGA AGTGCTCGGC 
GTCAATAGCA AGGTCCAGTT GGCCGAACTG GAGCGCCAGC ATCAGCTCAA TCTGGCCGGT 
GAGTTACTGG TCGCTGGCGT CAGACTGGCC GATCCGGCCC GTATCGATAT CCGCGGCGAA 
CTGACGCACG GTCGCGATGT GGCGATCGAT GTCGGTTGCG TCTTCGAAGG CAAGGTTGAA 
CTGGCTGACG CTGTCGAGGT CGGTCCTTAC TGCGTGCTGA AGAACGTCAA GGTTGGCGCC 
GGAACGAGGA TTGCGGCGTT TTGCCATTTC GAGGATGCGG TCATTGGTCC GGATGGCGTG 
CTCGGTCCTT ATGCCCGCCT GCGGCCGGGT ACCGAACTTG GCCCGGAAGT GCACATCGGC 
AACTTCGTCG AGGTCAAGAA GAGCATCATC GGTGCCCAGT CCAAGGCGAA CCATCTGGCC 
TATATCGGCG ATGCCGAGAT CGGTCAGCGT GTCAATGTTG GTGCCGGGAC CATTACCTGT 
AATTACGATG GGGCCAACAA GTTCAAGACC GTTATCGAAG ACGATGTCTT CATTGGTTCC 
GATACCCAAC TGGTCGCTCC TGTTACTGTG GGTCGCGGGG CAACGCTGGG GGCTGGCACG 
ACGCTGACCA AGGATGCCCC GCCCGATGCC TTGACCTTCT CGCGCCCCAG GCAGATGACA 
CTGCCGGGTT GGGAGCGTCC GAAAAAGGTG AAGAAATAA

Protein sequence

MNIVILAAGQ GKRMHSNLPK VLHPIAGKPL AQHVIDTARQ LSPEKLIVVY GHGGEVVRST 
LAAPDLSWAE QAQQLGTGHA VAQALSELGS AAQTLVLYGD VPLTTVATLK RLLQAGKDAL 
SVLTVDLANP SGYGRIVRDG AGNMISIVEE KDASAEQKAI REVNTGIMAV PTARLADWLG 
KLKNDNAQGE YYLTDIIALA VAEGMPVRTA QPEGEWEVLG VNSKVQLAEL ERQHQLNLAG 
ELLVAGVRLA DPARIDIRGE LTHGRDVAID VGCVFEGKVE LADAVEVGPY CVLKNVKVGA 
GTRIAAFCHF EDAVIGPDGV LGPYARLRPG TELGPEVHIG NFVEVKKSII GAQSKANHLA 
YIGDAEIGQR VNVGAGTITC NYDGANKFKT VIEDDVFIGS DTQLVAPVTV GRGATLGAGT 
TLTKDAPPDA LTFSRPRQMT LPGWERPKKV KK