Gene ECH74115_4417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4417
Symbol
ID	6968415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4093739
End bp	4094725
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	643388138
Product	hypothetical protein
Protein accession	YP_002272575
Protein GI	209397300
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.243215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCAAC TGATTGACGG CGTCTGGCAT GACACCTGGT ACGATACCAA ATCTACCGGC 
GGTAAATTTC AACGTTCAGC TTCCGCATTT CGTAACTGGC TCACTGCCGA TGGCGCTCCT 
GGCCCCACTG GCACAGGCGG TTTTATCGCA GAGAAAGATC GTTATCATCT CTATGTTTCA 
CTCGCCTGCC CGTGGGCGCA CCGCACGCTG ATCATGCGCA AACTCAAAGG ACTGGAACCG 
TTTATTTCCG TTTCCGTAGT GAACCCGCTG ATGCTGGAAA ACGGCTGGAC CTTTGATGAC 
AGTTTTCCGG GAGCAACCGG AGACACGCTC TATCAACATG AATTTTTGTA TCAGCTTTAT 
CTCCACGCCG ATCCACACTA CAGCGGACGA GTTACTGTTC CCGTGCTGTG GGACAAAAAG 
AACCACACCA TCGTCAGCAA CGAATCAGCA GAAATCATCC GCATGTTTAA TACCGCGTTT 
GATGCGCTGG GCGCGAAAGC GGGTGATTAC TACCCACCAG CCCTGCAAAC GAAAATTGAC 
GAACTTAACG GCTGGATTTA TGACACCGTT AACAACGGCG TGTATAAAGC TGGTTTTGCC 
ACCAGCCAGC AAGCCTACGA CGAAGCGGTG GAGAAAGTGT TTGAATCGCT GGCGCGACTG 
GAACAGATTT TAGGTCAGCA TCGTTACCTG ACCGGCAACC AGCTAACCGA AGCCGATATT 
CGCCTGTGGA CCACGCTGGT CCGTTTTGAT CCAGTGTATG TGACCCACTT CAAGTGTGAT 
AAGCACCGCA TCAGCGATTA CCTTAATCTG TATGGCTTCC TGCGTGATAT CTACCAGATG 
CCGGGAATTG CCGAAACAGT CAATTTCGAT CATATCCGTA ATCATTACTT CCGCAGTCAT 
AAGACCATCA ACCCTACGCG GATTATTTCA ATTGGTCCGT GGCAGGATCT CGATGAACCG 
CATGGACGAG ATGTTCGCTT AGGTTAA

Protein sequence

MGQLIDGVWH DTWYDTKSTG GKFQRSASAF RNWLTADGAP GPTGTGGFIA EKDRYHLYVS 
LACPWAHRTL IMRKLKGLEP FISVSVVNPL MLENGWTFDD SFPGATGDTL YQHEFLYQLY 
LHADPHYSGR VTVPVLWDKK NHTIVSNESA EIIRMFNTAF DALGAKAGDY YPPALQTKID 
ELNGWIYDTV NNGVYKAGFA TSQQAYDEAV EKVFESLARL EQILGQHRYL TGNQLTEADI 
RLWTTLVRFD PVYVTHFKCD KHRISDYLNL YGFLRDIYQM PGIAETVNFD HIRNHYFRSH 
KTINPTRIIS IGPWQDLDEP HGRDVRLG