Gene ECH74115_5778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5778
Symbol
ID	6967585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5410248
End bp	5411471
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	37%
IMG OID	643389408
Product	hypothetical protein
Protein accession	YP_002273801
Protein GI	209399763
COG category	[S] Function unknown
COG ID	[COG4269] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTT TAATTCAGGG AATTTTTATG GCTCAAGTTA TTAATGAAAT GGATGTTCCG 
TCCCATTCGT TTGTTTTTCA TGGTACAGGT GAGAGATATT TTCTTATTTG TGTGGTGAAT 
GTGTTGTTAA CGATTATAAC GCTAGGTATC TATTTACCAT GGGCATTAAT GAAATGTAAG 
CGTTATCTCT ATGCTAATAT GGAAGTTAAC GGACAACGAT TTTCTTATGG AATTACTGGT 
GGGAATGTTT TTTTTAGTTG TCTTGTTTTT GTTTTTTTCT ATTTCGCAAT CTTAATGACA 
GTGTCAGCAG ATATGCCGCT TATTGGCTGT GTTTTGACTT TGTCACTGTT GGTTTTGCTT 
ATATTTATGG CAGCAAAAGG ACTGCGTTAT CAGGCCTTGA TGACCAGTCT CAACGGCGTA 
AGATTTAGTT TTAATTGCTC TATGAAAGGG GTCTGGTGGG TAACCTTTTT CTTGCCGATT 
TTAATGGCCA TTGGGATGGG GACTGTTTTC TTTATCTCGA CAAAGATGCT ACATGCCAAT 
AGTTCAAGTA GTGTTATTGT ATCTGTGGTT CTGATGGCAA TAGTTGGTAT TGTTTCCATT 
GGTATTTTTA ATGGTACTTT ATATAGCCTG GTAATGAGTT TTCTCTGGAG CAATACCAGT 
TTCGGTATAC ATCGTTTCAA GGTGAAATTA GATACTGCGT ATTGTATAAA ATATGCCATC 
CTCGCATTTT TAGCTTTATT ACCTTTTCTC GCTGTTGCTG GTTATATTAT CTTCGATCAA 
ATATTAAATG CGTATGATAG TTCTGTGTAT GCAAATGATG ATATTGAGAA TTTACAGCAA 
TTTATGGAAA TGCAACGTAA AATGATAATC GCGCAGTTAA TCTATTATTT TGGGATTGCT 
GTTAGCACCA GTTATTTAAC GGTGTCGTTG CGAAATCATT TTATGAGCAA CCTGTCACTG 
AATGATGGGC GTATTCGTTT TCGCTCAACT TTAACATACC ACGGTATGCT TTATCGCATG 
TGTGCGTTGG TGGTGATATC CGGGATTACG GGCGGTCTGG CTTATCCACT GCTGAAAATA 
TGGATGATTG ACTGGCAGGC AAAAAATACG TATTTGCTGG GCGATTTGGA TGACCTTCCT 
TTAATCAATA AAGAAGAACA ACCAGATAAA GGCTTCTTAG CCAGTATTTC ACGGGGAATT 
ATGCCTTCTT TACCATTTCT GTAA

Protein sequence

MDFLIQGIFM AQVINEMDVP SHSFVFHGTG ERYFLICVVN VLLTIITLGI YLPWALMKCK 
RYLYANMEVN GQRFSYGITG GNVFFSCLVF VFFYFAILMT VSADMPLIGC VLTLSLLVLL 
IFMAAKGLRY QALMTSLNGV RFSFNCSMKG VWWVTFFLPI LMAIGMGTVF FISTKMLHAN 
SSSSVIVSVV LMAIVGIVSI GIFNGTLYSL VMSFLWSNTS FGIHRFKVKL DTAYCIKYAI 
LAFLALLPFL AVAGYIIFDQ ILNAYDSSVY ANDDIENLQQ FMEMQRKMII AQLIYYFGIA 
VSTSYLTVSL RNHFMSNLSL NDGRIRFRST LTYHGMLYRM CALVVISGIT GGLAYPLLKI 
WMIDWQAKNT YLLGDLDDLP LINKEEQPDK GFLASISRGI MPSLPFL