Gene ECH74115_2976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2976
Symbol	gne
ID	6971182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2753564
End bp	2754559
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	45%
IMG OID	643386816
Product	UDP-N-acetylglucosamine 4-epimerase
Protein accession	YP_002271284
Protein GI	209398311
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000873093
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.00000190147
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGATA ACGTTTTGCT CATAGGAGCT TCCGGATTCG TAGGAACCCG ACTACTTGAA 
ACGGCAATTG CTGACTTTAA TATCAAGAAC CTGGACAAAC AGCAGAGCCA CTTTTATCCA 
GAAATCACAC AGATTGGTGA TGTTCGTGAT CAACAGGCAC TCGACCAGGC GTTAGCCGGT 
TTTGACACTG TTGTACTACT GGCAGCGGAA CACCGCGATG ACGTCAGCCC TACTTCTCTC 
TATTATGATG TCAACGTTCA GGGTACCCGC AATGTGCTGG CGGCCATGGA AAAAAATGGC 
GTTAAAAATA TCATCTTTAC CAGTTCCGTT GCTGTTTATG GTTTGAACAA ACACAACCCT 
GACGAAAACC ATCCACACGA CCCTTTCAAC CACTACGGCA AAAGCAAGTG GCAGGCGGAG 
GAAGTGCTGC GTGAATGGTA TAACAAAGCA CCAACAGAAC GTTCATTAAC TATCATCCGT 
CCTACCGTTA TCTTCGGTGA ACGCAACCGC GGTAACGTCT ATAACTTGCT GAAACAGATC 
GCTGGCGGCA AGTTTATGAT GGTGGGCGCA GGGACTAACT ATAAGTCCAT GGCTTATGTT 
GGAAACATTG TTGAGTTTAT CAAGTACAAA CTGAAGAATG TTGCCGCAGG TTACGAGGTT 
TATAACTACG TTGATAAGCC AGACCTGAAC ATGAACCAGT TGGTTGCTGA AGTTGAACAA 
AGCCTGAACA AAAAGATCCC TTCTATGCAC TTGCCTTACC CACTAGGAAT GCTGGGTGGA 
TATTGCTTTG ATATCCTGAG CAAAATTACG GGCAAAAAAT ACGCTGTCAG CTCTGTGCGC 
GTGAAAAAAT TCTGCGCAAC AACACAGTTT GACGCAACGA AAGTGCATTC TTCAGGTTTT 
GTGGCACCGT ATACGCTGTC GCAAGGTCTG GATCGAACTC TGCAGTATGA ATTCGTCCAT 
GCCAAAAAAG ACGACATAAC GTTTGTTTCT GAGTAA

Protein sequence

MNDNVLLIGA SGFVGTRLLE TAIADFNIKN LDKQQSHFYP EITQIGDVRD QQALDQALAG 
FDTVVLLAAE HRDDVSPTSL YYDVNVQGTR NVLAAMEKNG VKNIIFTSSV AVYGLNKHNP 
DENHPHDPFN HYGKSKWQAE EVLREWYNKA PTERSLTIIR PTVIFGERNR GNVYNLLKQI 
AGGKFMMVGA GTNYKSMAYV GNIVEFIKYK LKNVAAGYEV YNYVDKPDLN MNQLVAEVEQ 
SLNKKIPSMH LPYPLGMLGG YCFDILSKIT GKKYAVSSVR VKKFCATTQF DATKVHSSGF 
VAPYTLSQGL DRTLQYEFVH AKKDDITFVS E