Gene ECH74115_3286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3286
Symbol
ID	6967278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3018165
End bp	3019322
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	54%
IMG OID	643387099
Product	hypothetical protein
Protein accession	YP_002271563
Protein GI	209395998
COG category	[S] Function unknown
COG ID	[COG2311] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.385085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCGCA ACGTCACGCT CGACTTTGTT CGCGGCGTCG CCATTCTGGG GATCCTGCTA 
TTAAACATCA GCGCCTTTGG GCTACCAAAG GCGGCTTATC TTAATCCCGC CTGGTACGGC 
GCTATTACGC CGCAGGATGC ATGGACCTGG GCATTTCTCG ATCTCATCGG CCAGGTGAAA 
TTCCTCACGC TTTTTGCGCT GCTGTTTGGT GCTGGCCTGC AAATGTTGCT GCCCCGTGGC 
AGACGCTGGA TCCAGTCGCG GTTAACGCTG TTAGTCTTGC TGGGCTTTAT TCACGGTTTA 
TTGTTCTGGG ACGGCGATAT TCTGCTGGCT TACGGGCTGG TGGGCTTAAT CTGCTGGCGG 
CTGGTGCGCG ATGCGCCATC GGTAAAAAGC CTTTTTAATA CCGGCGTCAT GCTTTATCTG 
GTGGGGCTTG GCGTTTTGCT GTTATTGGGG TTGATTTCCG ATAGCCAGAC TAGCCGCGCC 
TGGACGCCGG ATGCATCGGC TATTTTATAT GAAAAATACT GGAAGCTTCA CGGCGGCGTT 
GAAGCGATCA GTAATCGTGC CGATGGTGTT GGGAACAGTT TATTGGCACT GGGCGCACAG 
TATGGCTGGC AACTGGCTGG GATGATGCTC ATTGGTGCCG CATTGATGCG CAGTGGCTGG 
CTGAAAGGGC AGTTCAGCTT ACGTCACTAT CGTCGTACTG GTTTTGTGCT AGTGGCGATT 
GGGGTGATCA TTAACCTTCC TGCCATCGCC CTGCAATGGC AGCTGGACTG GGCGTATCGC 
TGGTGTGCCT TCTTACTTCA AATGCCGCGG GAACTGAGTG CGCCGTTTCA GGCGATTGGC 
TATGCGTCGC TGTTTTATGG CTTCTGGCCG CAATTGAGCC GCTTTAAGCT GGTGCTGGCG 
ATCGCCTGCG TCGGACGGAT GGCGCTGACC AACTATCTAT TGCAAACGCT GATTTGTACC 
ACGCTTTTTT ACCACCTCGG TCTGTTTATG CAGTTTGACC GTCTGGAATT GCTGGCGTTT 
GTTATTCCGG TATGGCTGGC GAATATTCTC TTCTCTGTTA TCTGGCTGCG TTACTTCCGC 
CAGGGGCCGG TGGAATGGCT CTGGCGTCAG TTAACTTTGC GTGCTGCCGG ACCGGCAATA 
TCTAAAACAT CAAGATAA

Protein sequence

MERNVTLDFV RGVAILGILL LNISAFGLPK AAYLNPAWYG AITPQDAWTW AFLDLIGQVK 
FLTLFALLFG AGLQMLLPRG RRWIQSRLTL LVLLGFIHGL LFWDGDILLA YGLVGLICWR 
LVRDAPSVKS LFNTGVMLYL VGLGVLLLLG LISDSQTSRA WTPDASAILY EKYWKLHGGV 
EAISNRADGV GNSLLALGAQ YGWQLAGMML IGAALMRSGW LKGQFSLRHY RRTGFVLVAI 
GVIINLPAIA LQWQLDWAYR WCAFLLQMPR ELSAPFQAIG YASLFYGFWP QLSRFKLVLA 
IACVGRMALT NYLLQTLICT TLFYHLGLFM QFDRLELLAF VIPVWLANIL FSVIWLRYFR 
QGPVEWLWRQ LTLRAAGPAI SKTSR