Gene EcSMS35_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1020
Symbol	gne
ID	6143898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1041016
End bp	1042011
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	45%
IMG OID	641615907
Product	UDP-N-acetylglucosamine 4-epimerase
Protein accession	YP_001743099
Protein GI	170683772
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.280879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGATA ACGTTTTGCT CATAGGAGCT TCCGGATTCG TAGGAACCCG ACTACTTGAA 
ACGGCAATTG CTGACTTTAA TATCAAGAAC CTGGACAAAC AGCAGAGCCA CTTTTATCCA 
GAAATCACAC AGATTGGCGA TGTTCGTGAT CAACAGGCAC TCGACCAGGC GTTAGCCGGT 
TTTGACACTG TTGTACTACT GGCAGCGGAA CACCGCGATG ACGTCAGCCC TACTTCTCTC 
TATTATGATG TCAACGTTCA GGGTACCCGC AATGTGCTGG CGGCCATGGA AAAAAATGGC 
GTTAAAAATA TCATCTTTAC CAGTTCCGTT GCTGTTTATG GTTTGAACAA ACACAACCCT 
GACGAAAACC ATCCACACGA TCCTTTCAAC CACTACGGCA AAAGTAAGTG GCAGGCAGAG 
GAAGTGCTGC GTGAATGGTA TAACAAAGCA CCAACAGAAC GTTCATTAAC TATCATCCGT 
CCTACCGTTA TCTTCGGTGA ACGCAACCGC GGTAACGTCT ATAACTTGCT GAAACAGATC 
GCTGGCGGCA AGTTTATGAT GGTGGGCGCA GGGACTAACT ATAAGTCCAT GGCTTATGTT 
GGAAACATTG TTGAGTTTAT CAAGTACAAA CTGAAGAATG TTGCCGCAGG TTATGAGGTT 
TATAACTACG TTGATAAGCC AGACCTGAAC ATGAACCAGT TGGTTGCTGA AGTTGAACAA 
AGCCTGAACA AAAAGATCCC TTCTATGCAC TTGCCTTACC CACTAGGAAT GCTGGGTGGA 
TATTGCTTTG ATATCCTGAG CAAAATTACG GGCAAAAAAT ACGCTGTCAG CTCAGTGCGC 
GTGAAAAAAT TCTGCGCAAC AACACAGTTT GACGCAACGA AAGTGCATTC TTCAGGTTTT 
GTGGCACCGT ATACGCTGTC GCAAGGTCTG GATCGAACAC TGCAGTATGA ATTCGTTCAT 
GCCAAAAAAG ACGACATAAC GTTTGTTTCT GAGTAA

Protein sequence

MNDNVLLIGA SGFVGTRLLE TAIADFNIKN LDKQQSHFYP EITQIGDVRD QQALDQALAG 
FDTVVLLAAE HRDDVSPTSL YYDVNVQGTR NVLAAMEKNG VKNIIFTSSV AVYGLNKHNP 
DENHPHDPFN HYGKSKWQAE EVLREWYNKA PTERSLTIIR PTVIFGERNR GNVYNLLKQI 
AGGKFMMVGA GTNYKSMAYV GNIVEFIKYK LKNVAAGYEV YNYVDKPDLN MNQLVAEVEQ 
SLNKKIPSMH LPYPLGMLGG YCFDILSKIT GKKYAVSSVR VKKFCATTQF DATKVHSSGF 
VAPYTLSQGL DRTLQYEFVH AKKDDITFVS E