Gene ECH74115_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1980
Symbol	uspE
ID	6968755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1872846
End bp	1873796
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	50%
IMG OID	643385904
Product	universal stress protein UspE
Protein accession	YP_002270393
Protein GI	209398539
COG category	[T] Signal transduction mechanisms
COG ID	[COG0589] Universal stress protein UspA and related nucleotide-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.420697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATGT ATCAGAACAT GCTCGTTGTT ATCGATCCTA ACCAGGACGA CCAACCAGCA 
TTGCGGCGAG CTGTTTATTT ACATCAACGG ATTGGTGGCA AAATTAAAGC CTTTTTGCCG 
ATCTATGACT TCTCATACGA AATGACCACC CTGCTCTCCC CGGACGAACG TACCGCTATG 
CGTCAGGGCG TCATCAGCCA GCGTACAGCC TGGATCCACG AGCAGGCAAA ATATTATCTC 
AATGCTGGCG TTCCCATTGA AATTAAAGTG GTCTGGCATA ACCGTCCTTT CGAAGCCATC 
ATTCAGGAAG TGATCAGCGG CGGGCACGAT TTGGTGCTAA AAATGGCGCA CCAACATGAC 
CGTCTGGAAG CGGTGATTTT TACGCCAACG GACTGGCACC TGTTACGCAA ATGCCCAAGC 
CCGGTGTGGA TGGTGAAAGA CCAGCCGTGG CCGGAAGGAG GTAAGGCGCT GGTGGCGGTG 
AATCTCGCCA GTGAAGAGCC GTATCATAAT GCGCTCAATG AAAAACTGGT CAAAGAGACG 
ATCGAACTGG CAGAACAAGT CAACCATACC GAAGTTCATC TGGTTGGCGC TTATCCGGTA 
ACGCCAATTA ATATCGCGAT TGAACTGCCG GAATTTGATC CGAGCGTTTA TAACGATGCC 
ATTCGTGGGC AACATTTGCT GGCAATGAAA GCCCTGCGGC AGAAATTCGG CATTAATGAA 
AACATGACGC ACGTAGAAAA AGGTCTGCCA GAAGAGGTGA TTCCTGATTT GGCGGAGCAC 
TTACAGGCGG GGATTGTGGT TCTGGGCACG GTAGGACGCA CCGGTATTTC AGCAGCATTC 
CTCGGCAACA CGGCGGAACA GGTGATTGAT CATCTTCGCT GCGATCTGTT GGTCATTAAA 
CCTGACCAGT ATCAGACACC CGTTGAACTG GATGACGAAG AAGACGATTA A

Protein sequence

MAMYQNMLVV IDPNQDDQPA LRRAVYLHQR IGGKIKAFLP IYDFSYEMTT LLSPDERTAM 
RQGVISQRTA WIHEQAKYYL NAGVPIEIKV VWHNRPFEAI IQEVISGGHD LVLKMAHQHD 
RLEAVIFTPT DWHLLRKCPS PVWMVKDQPW PEGGKALVAV NLASEEPYHN ALNEKLVKET 
IELAEQVNHT EVHLVGAYPV TPINIAIELP EFDPSVYNDA IRGQHLLAMK ALRQKFGINE 
NMTHVEKGLP EEVIPDLAEH LQAGIVVLGT VGRTGISAAF LGNTAEQVID HLRCDLLVIK 
PDQYQTPVEL DDEEDD