Gene ECH74115_1158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1158
Symbol
ID	6972156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1178633
End bp	1179682
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	53%
IMG OID	643385158
Product	hypothetical protein
Protein accession	YP_002269657
Protein GI	209396179
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.53743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGTAT TACTTCGACC TGTTCTGGTA CCGGAACTCG GTCTGGTTAT CGTTAAGCCA 
GGCCGTGAAT CAATGTCAGC ATTCCATAAC GGCAGAATAC TGGTGGAGCC GGAACCAAAA 
AGCATGCGAG CTCTGCCGTC CGGGGTTGTA CCTGCCGTTC ACCAGCCGCT GGCGGAAGAT 
AAATCACTAC TGCCATTTTT CAGCGATGAG CGGGTGATCC GTGCTGCGGG TGGCGCTGGT 
GCACTGTCTG ACTGGTTATT ACGTCACGTG AAATCCTGCC AGTGGCCTCA TGGTGATTAT 
CATCACAGCG AAACTGTCAT ACATCGTTAC GGTACCGGCG CGATGGTGTT GTGCTGGCAC 
TGCGACAACC AGCTGCGCGA CCAGACATCC GAATCACTTG AGCAACTTGC TCAACAGAAT 
CTGGCCGCCT GGATGATTGA CGTCATCCGC CACGCAATGA ATGGCATACA GGAACGGGAA 
TTATCGCTGG CTGAATTATC CTGGTGGGCA GTCTGCAATC AGGTGGTGGA CGCATTACCT 
GAGGCAGTAT CGCGTCGTTC TCTGGGATTA CCGGCGGAAA AAATCCGCTC CGTATACCGT 
GAAAGCGACA TCATACCGGG AGAACAGACC GCCACCAGCA TACTGAAGCA GCGCACAAAA 
AATATTGCGC TACCGCCTCA CACCCACCAG CAACAGAACC CACCACAGGA AAAGACGGTG 
GTCAGCATTG CCGTTGATCC GGAGTCTCCG AAATCCTTCA TGAAACGACC TAAACGTCGC 
CGCTGGGTAA ATGAGAAATA CACACGCTGG GTAAAGACAC AGCCGTGTGC GTGTTGTGGT 
AAGCCAGCGG ACGATCCTCA TCATCTGATT GGTCATGGTC AGGGTGGAAT GGGAACAAAA 
TCCCACGATA TTTTCACGCT ACCGCTGTGT CGGGAGCATC ACAACGAGCT TCATGCGGAT 
CCGCTGGCGT TCGAAGAAAA GCATGGTTCC CAGGTTGATT TAATTTTTCG TTTTCTTGAT 
CACGCTTTTG CAACCGGCGT GCTCGGGTAA

Protein sequence

MRVLLRPVLV PELGLVIVKP GRESMSAFHN GRILVEPEPK SMRALPSGVV PAVHQPLAED 
KSLLPFFSDE RVIRAAGGAG ALSDWLLRHV KSCQWPHGDY HHSETVIHRY GTGAMVLCWH 
CDNQLRDQTS ESLEQLAQQN LAAWMIDVIR HAMNGIQERE LSLAELSWWA VCNQVVDALP 
EAVSRRSLGL PAEKIRSVYR ESDIIPGEQT ATSILKQRTK NIALPPHTHQ QQNPPQEKTV 
VSIAVDPESP KSFMKRPKRR RWVNEKYTRW VKTQPCACCG KPADDPHHLI GHGQGGMGTK 
SHDIFTLPLC REHHNELHAD PLAFEEKHGS QVDLIFRFLD HAFATGVLG