Gene EcSMS35_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4151
Symbol	wecC
ID	6146455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4250907
End bp	4252169
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	54%
IMG OID	641618974
Product	UDP-N-acetyl-D-mannosamine dehydrogenase
Protein accession	YP_001746106
Protein GI	170684251
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTG CGACCATTTC TGTTATCGGA CTGGGTTACA TCGGGCTGCC TACAGCAGCT 
GCGTTTGCCT CAAGGCAAAA ACAGGTGATT GGTGTCGATA TCAACCAACA CGCGGTTGAT 
ACCATCAATC GTGGCGAAAT CCATATCGTC GAACCTGATT TGGCGAGCGT AGTAAAAACT 
GCCGTAGAAG GCGGTTTTTT ACGAGCGAGC ACGACGCCAG TTGAAGCGGA TGCCTGGCTG 
ATTGCTGTAC CCACGCCGTT TAAAGGCGAT CATGAGCCAG ATATGACCTA CGTTGAATCG 
GCTGCTCGCT CCATTGCGCC AGTGCTGAAA AAAGGCGCGC TGGTGATCCT TGAATCCACC 
TCGCCGGTGG GGTCAACCGA GAAGATGGCA GAATGGTTAG CAGAGATGCG TCCAGATCTC 
ACTTTCCCAC AGCAGGTGGG CGAGTTGGCG GACGTCAACA TTGCTTACTG TCCGGAACGC 
GTGTTACCGG GCCAGGTTAT GGTCGAGCTG ATTAAAAACG ATCGCGTGAT TGGTGGTATG 
ACGCCGGTTT GTTCGGCCCG CGCCAGCGAA CTGTACAAAA TTTTCCTCGA AGGTGAGTGT 
GTCGTCACTA ACTCGCGGAC GGCGGAAATG TGTAAGCTCA CCGAAAACAG CTTCCGCGAT 
GTGAATATCG CTTTTGCTAA CGAACTGTCG CTGATTTGTG CCGATCAGGG AATTAACGTC 
TGGGAACTGA TTCGCCTGGC GAATCGTCAC CCTCGCGTTA ATATTCTTCA GCCTGGTCCT 
GGCGTGGGCG GTCACTGCAT TGCTGTTGAT CCGTGGTTTA TCGTGGCACA GAACCCGCAG 
CAGGCGCGGC TTATCCGTAC CGCGCGCGAA GTGAACGATC ACAAACCGTT CTGGGTTATC 
GATCAGGTGA AAGCGGCGGT TGCCGACTGC CTTGCTGCTA CCGATAAACG CGCCAGTGAA 
CTGAAAATCG CCTGCTTTGG TCTGGCGTTT AAACCGAATA TTGATGACCT GCGCGAAAGC 
CCGGCGATGG AAATCGCTGA ACTGCTCGCC CAGTGGCATA GCGGCGAAAC GCTGGTTGTT 
GAGCCTAACA TCCACCAGTT GCCGAAAAAA CTGACCGGGC TTTGTACTCT GGCGCAGCTT 
GACGAGGCGC TGGCAACGGC AGACGTGCTG GTGATGCTGG TCGATCATAG TCAGTTCAAA 
GTTATCAATG GCGACAATGT CCATCAGCAG TATGTCGTCG ATGCCAAAGG AGTTTGGCGC 
TGA

Protein sequence

MSFATISVIG LGYIGLPTAA AFASRQKQVI GVDINQHAVD TINRGEIHIV EPDLASVVKT 
AVEGGFLRAS TTPVEADAWL IAVPTPFKGD HEPDMTYVES AARSIAPVLK KGALVILEST 
SPVGSTEKMA EWLAEMRPDL TFPQQVGELA DVNIAYCPER VLPGQVMVEL IKNDRVIGGM 
TPVCSARASE LYKIFLEGEC VVTNSRTAEM CKLTENSFRD VNIAFANELS LICADQGINV 
WELIRLANRH PRVNILQPGP GVGGHCIAVD PWFIVAQNPQ QARLIRTARE VNDHKPFWVI 
DQVKAAVADC LAATDKRASE LKIACFGLAF KPNIDDLRES PAMEIAELLA QWHSGETLVV 
EPNIHQLPKK LTGLCTLAQL DEALATADVL VMLVDHSQFK VINGDNVHQQ YVVDAKGVWR