Gene ECH74115_2708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2708
Symbol
ID	6969526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2541349
End bp	2542488
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	35%
IMG OID	643386569
Product	hypothetical protein
Protein accession	YP_002271048
Protein GI	209397909
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.659455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.29624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCCAT TAAATGATCT GTCGTTAAAA ACTCAGTCGG TTCAATTAAA TAAAATCACA 
TCGAATACTG AGTCTACGAT AAAACAACAC GAGTTAGTAT CTGATGATGC AATCATAAAT 
GAATTATCAA GTGAGTTAGT CAGTTGTCTT GGAAATGATA AGTTTACACC AGTTAGTGAA 
GACAGCAACT TACTGAATAT GCTGTCTGAA TTTAAGTTAT TGAGAGAGCA ATGTTTCAGG 
TGGGGTAATT ATACTCTATT GTTTGAAAAT TATGGGGCTT ATGATAAGAC GGGATCTATC 
ACGATAGAAA AAAGTCAGGG GGAGGGGACT TTACCCATTC GGCATAAATT AGAGTTTATA 
TCGACCAATA TTGCAGAGTT GCTGGACAAG TTAACCAAAA TTACAGATGC CAGGCTTTGC 
AAAGGTTTCA GTGACTGGGC TAGTTCAGTC AAAGAAGGCG CATCGAATGA CTTGAAAGAA 
AATGTGGATA GAGCATTGGT GAGAATGTTT AAATGTGTTA AGCTTCACAG TAATGAACTT 
AACTTATCAA GCCTTTCTTT GGGTTCTGTG CCGCCTCTTC CTGAGTGGAT TGAAATGCTT 
AGCCTTGTTT ATAATGAACT TGATTCAATA CAGGTGCCCG AATCGTGCAA AGAATTAGAA 
CTCGATTTCA ATAACCTTAC AGAATTTCCA CAAGTACCTG ATGGAATTAC CCTGATCTCC 
GTAAATAATA ACCTGATATC GTATATTGAC TCATTTCCGC CAAAGGCTAA GAAAATTTTT 
ATTTGTCACA ATAAGCTATC GGAAATACCA GCACTACCAG ACACCGCTAA GGTTTTTGAT 
TGTAGTGAGA ATAATATTAA AGAAATTAGA TGGTTCCCCA AAAATTTGAA AGAAGCGTAT 
ATTGAATATA ATAAGATTGA GGTTATTCCT GCGATACCTG GCAATTTAAA ATTACTTTGT 
ATGAAATGTA ATCCTATTAA AGAGGCATTT TTAATGCCAT GGACCCTTAC AGGGATTCGC 
TATGAAATAT CGCAGCGAAA ATATATTGTT ATGAATCCCG CCGATTATGA TAAATATTCC 
GATATGGTTA AAAAGCATGT AATAGATGGT GAGGAATTCA TAATTAAATA TTATATGTAA

Protein sequence

MFPLNDLSLK TQSVQLNKIT SNTESTIKQH ELVSDDAIIN ELSSELVSCL GNDKFTPVSE 
DSNLLNMLSE FKLLREQCFR WGNYTLLFEN YGAYDKTGSI TIEKSQGEGT LPIRHKLEFI 
STNIAELLDK LTKITDARLC KGFSDWASSV KEGASNDLKE NVDRALVRMF KCVKLHSNEL 
NLSSLSLGSV PPLPEWIEML SLVYNELDSI QVPESCKELE LDFNNLTEFP QVPDGITLIS 
VNNNLISYID SFPPKAKKIF ICHNKLSEIP ALPDTAKVFD CSENNIKEIR WFPKNLKEAY 
IEYNKIEVIP AIPGNLKLLC MKCNPIKEAF LMPWTLTGIR YEISQRKYIV MNPADYDKYS 
DMVKKHVIDG EEFIIKYYM