Gene EcHS_A4004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4004
Symbol	wecC
ID	5592286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3999673
End bp	4000935
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	54%
IMG OID	640923108
Product	UDP-N-acetyl-D-mannosamine dehydrogenase
Protein accession	YP_001460579
Protein GI	157163261
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTTG CGACCATTTC TGTTATCGGA CTGGGTTATA TCGGGCTGCC AACGGCAGCA 
GCGTTTGCCT CACGGCAAAA ACAGGTAATT GGTGTCGATA TCAACCAACA TGCGGTTGAT 
ACCATCAATC GTGGCGAAAT CCATATCGTC GAACCTGATT TGGCGAGTGT AGTAAAAACT 
GCCGTAGAAG GCGGTTTTTT ACGAGCGAGC ACGACGCCAG TTGAAGCGGA TGCCTGGCTG 
ATTGCTGTAC CCACGCCGTT TAAGGGCGAT CATGAGCCAG ATATGACCTA CGTTGAATCG 
GCTGCTCGCT CCATTGCGCC AGTGCTGAAA AAAGGCGCGC TGGTGATCCT TGAATCCACC 
TCGCCGGTGG GGTCAACCGA GAAGATGGCA GAATGGTTAG CAGAGATGCG TCCGGATCTC 
ACTTTCCCGC AGCAGGTGGG CGAGCAGGCG GACGTCAACA TTGCTTACTG CCCGGAACGC 
GTGTTACCAG GACAGGTAAT GGTCGAGCTG ATTAAAAACG ATCGCGTGAT TGGTGGTATG 
ACGCCGGTTT GTTCGGCCCG CGCCAGCGAA CTGTACAAAA TTTTCCTCGA AGGTGAGTGT 
GTCGTCACTA ACTCGCGGAC GGCGGAAATG TGTAAGCTCA CCGAAAACAG CTTCCGCGAT 
GTGAATATCG CTTTTGCTAA TGAATTGTCG CTGATTTGTG CCGATCAGGG GATTAACGTC 
TGGGAACTGA TTCGCCTGGC GAATCGTCAC CCTCGCGTTA ATATTCTTCA GCCTGGCCCT 
GGCGTGGGCG GTCACTGCAT TGCTGTTGAT CCGTGGTTTA TCGTGGCACA GAACCCCCAG 
CAGGCGCGGC TTATCCGTAC CGCGCGCGAA GTTAACGATC ACAAACCGTT CTGGGTTATC 
GATCAGGTGA AAGCGGCGGT TGCCGACTGC CTTGCTGCTA CCGATAAACG CGCCAGTGAA 
CTGAAAATCG CCTGCTTTGG TCTGGCGTTT AAACCGAATA TTGATGACCT GCGCGAAAGC 
CCGGCGATGG AAATCGCTGA ACTGATCGCC CAGTGGCACA GCGGCGAAAC GCTGGTTGTT 
GAGCCTAACA TCCACCAGTT GCCGAAAAAA CTGACCGGGC TTTGTACTCT GGCGCAGCTT 
GACGAGGCGC TGGCAACGGC AGACGTGCTG GTGATGCTGG TCGATCATAG TCAGTTCAAA 
GTTATCAATG GCGACAATGT CCATCAGCAG TATGTCGTCG ATGCCAAAGG AGTCTGGCGC 
TGA

Protein sequence

MSFATISVIG LGYIGLPTAA AFASRQKQVI GVDINQHAVD TINRGEIHIV EPDLASVVKT 
AVEGGFLRAS TTPVEADAWL IAVPTPFKGD HEPDMTYVES AARSIAPVLK KGALVILEST 
SPVGSTEKMA EWLAEMRPDL TFPQQVGEQA DVNIAYCPER VLPGQVMVEL IKNDRVIGGM 
TPVCSARASE LYKIFLEGEC VVTNSRTAEM CKLTENSFRD VNIAFANELS LICADQGINV 
WELIRLANRH PRVNILQPGP GVGGHCIAVD PWFIVAQNPQ QARLIRTARE VNDHKPFWVI 
DQVKAAVADC LAATDKRASE LKIACFGLAF KPNIDDLRES PAMEIAELIA QWHSGETLVV 
EPNIHQLPKK LTGLCTLAQL DEALATADVL VMLVDHSQFK VINGDNVHQQ YVVDAKGVWR