Gene Dd1591_4197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_4197
Symbol
ID	8117647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	+
Start bp	4740268
End bp	4741638
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	56%
IMG OID	644854577
Product	UDP-N-acetylglucosamine pyrophosphorylase
Protein accession	YP_003006472
Protein GI	251791751
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAACA GTGCAATGAG TGTGGTTATC CTTGCCGCCG GTAAGGGAAC CCGCATGTAT 
TCCGATCTTC CCAAAGTTCT TCATCCTCTG GCGGGTAAAC CGATAGTTAA GCATGTGATC 
GATGCGGCGA TGGCGGTTGG CGCTCGTCGT ATTCATCTGG TTTACGGACA CGGTGCAAAC 
TTGATTCGGG AAACGCTGAC GGAAACGTCG TTGAATTGGG TATTGCAGGC CGAGCAGTTG 
GGAACCGGCC ATGCGGTGCA GCAAGCGGCC GATGGTTTTG ACGATAACGA AGACATTCTG 
ATTCTGTACG GCGATGTGCC GCTGATTTCC CCTGCAACGT TGCAGCGCCT GGTGGCAGCC 
AAACCGCAAG GCGGGATTGG CCTGCTGACC GTCAATCTGG CTGACCCTAC CGGTTACGGC 
CGTATTGTGC GGGACAACGG CGAAGTGGTG GGGATTGTGG AGCATAAAGA CGCCACCGAG 
CAGCAGCGTG CGATCACCGA AATCAACACC GGCATTCTGG TGGCGGGCGG GCGCGATTTG 
AAGCGTTGGT TAAGCCAGCT CAATAACCAC AATGTGCAGG GCGAATATTA TCTTACCGAT 
ATCATCGCCA TGGCATCGCA GGAAGGCCAG CGCGTGGTGG CGGTGCAGCC GTCGCGTCTG 
AGTGAGGTGG AAGGCATCAA TAACCGTCTG CAACTGGCGA CGCTGGAGCG TACTTACCAG 
CGCGAACAGG CGGAGCAGTT ATTGCTGGCG GGTGTTATGC TGCTGGACCC TGCGCGTTTT 
GACCTGCGTG GCGAACTGGT GCATGGCCGT GATGTGACGA TCGATGCCAA CGTCATTCTG 
GAAGGCCGGG TGACGTTGGG CAATCGGGTG AAAATCGGTG CGGGCTGCGT GATCAAAAAC 
AGTGAGATCG GCGACGATTG CGAGCTTAGC CCCTACACCG TGGCGGAAAA CGCAGTACTG 
GAAGCGCGTT GTACCGTTGG CCCGTTTGCT CGCCTGCGCC CCGGCGCGGT GCTGGAAGAA 
GAGGCGCATG TCGGCAATTT TGTTGAATTG AAAAAGGCGC GTCTCGGCAA AGGATCGAAA 
GCCGGTCATC TGACTTACCT CGGTGATGCG GAAATCGGCT CTGATGTGAA CATCGGCGCA 
GGTGTGATTA CCTGTAACTA CGACGGCGCC AATAAACACC AGACGATAAT TGGCGACGAT 
GTGTTTGTCG GTTCGGATAG CCAGTTGATT GCACCGGTTA AGGTGGCCAA CGGCGCCACT 
ATTGGGGCAG GCACTACCGT CACCCATGAT GTGGGTGAAA ACGAACTGGT TATCAGCCGC 
GTTAAGCAGA CTCATATCAG CGGCTGGAAA CGCCCGGTGA AGAAAAAATA G

Protein sequence

MSNSAMSVVI LAAGKGTRMY SDLPKVLHPL AGKPIVKHVI DAAMAVGARR IHLVYGHGAN 
LIRETLTETS LNWVLQAEQL GTGHAVQQAA DGFDDNEDIL ILYGDVPLIS PATLQRLVAA 
KPQGGIGLLT VNLADPTGYG RIVRDNGEVV GIVEHKDATE QQRAITEINT GILVAGGRDL 
KRWLSQLNNH NVQGEYYLTD IIAMASQEGQ RVVAVQPSRL SEVEGINNRL QLATLERTYQ 
REQAEQLLLA GVMLLDPARF DLRGELVHGR DVTIDANVIL EGRVTLGNRV KIGAGCVIKN 
SEIGDDCELS PYTVAENAVL EARCTVGPFA RLRPGAVLEE EAHVGNFVEL KKARLGKGSK 
AGHLTYLGDA EIGSDVNIGA GVITCNYDGA NKHQTIIGDD VFVGSDSQLI APVKVANGAT 
IGAGTTVTHD VGENELVISR VKQTHISGWK RPVKKK