Gene ECH74115_5735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5735
Symbol
ID	6970610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5370535
End bp	5371878
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	50%
IMG OID	643389368
Product	putative transporter
Protein accession	YP_002273761
Protein GI	209400045
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAACA GTATTTTAGT CATACTCTGC TTGATCGCTG TAAGTGCGTT CTTCTCGATG 
TCTGAGATCT CACTTGCCGC CTCACGCAAA ATCAAACTTA AACTGCTGGC TGATGAAGGC 
AATATAAATG CCCAACGCGT TCTGAATATG CAGGAAAATC CCGGCATGTT CTTTACCGTG 
GTCCAAATCG GTCTGAACGC AGTGGCGATT CTCGGCGGTA TCGTCGGTGA TGCGGCATTT 
TCTCCAGCTT TTCACAGCCT GTTCTCCCGC TATATGTCGG CAGAGCTCTC TGAGCAACTG 
AGCTTTATTC TCTCTTTCTC GTTAGTGACT GGCATGTTTA TCCTGTTTGC GGATTTAACC 
CCGAAACGCA TCGGTATGAT TGCGCCAGAA GCTGTGGCTT TGCGTATCAT CAACCCGATG 
CGCTTCTGCC TGTACGTTTG CACCCCGCTG GTGTGGTTCT TCAACGGCCT GGCGAACATA 
ATCTTCCGTA TTTTCAAACT GCCAATGGTA CGTAAAGATG ACATCACTTC TGATGACATC 
TACGCGGTAG TGGAAGCCGG TGCGCTGGCG GGCGTGTTAC GTAAACAGGA ACACGAGCTG 
ATTGAAAACG TCTTTGAGCT GGAATCCCGT ACCGTTCCGT CTTCAATGAC ACCGCGTGAA 
AACGTGATTT GGTTTGATCT CCACGAAGAT GAGCAAAGTC TGAAAAATAA GGTGGCGGAA 
CATCCGCACT CTAAGTTCCT CGTCTGTAAT GAAGATATTG ACCACATCAT CGGCTATGTC 
GATTCTAAAG ACCTGCTGAA CCGCGTGCTG GCTAACCAAA GCCTGGCACT GAACAGCGGC 
GTACAAATTC GCAACACGCT GATTGTGCCG GATACGTTAA CCCTTTCAGA GGCGTTGGAA 
AGTTTTAAAA CCGCAGGAGA AGACTTCGCG GTGATCATGA ACGAGTACGC GCTGGTAGTG 
GGGATCATCA CCCTCAACGA CGTGATGACC ACGCTGATGG GCGATCTGGT CGGTCAGGGA 
CTGGAAGAGC AGATTGTCGC CCGTGATGAG AACTCATGGC TGATTGACGG CGGCACTCCG 
ATTGACGACG TCATGCGCGT GCTGGATATT GACGAGTTCC CGCAGTCGGG CAACTACGAA 
ACCATCGGCG GCTTTATGAT GTTTATGCTG CGTAAGATCC CGAAACGCAC CGATTCGGTG 
AAATTCGCCG GCTACAAATT TGAAGTGGTG GATATCGATA ACTACCGCAT CGACCAGCTG 
CTGGTGACCC GGATCGACAG CAAGGCCACA GCCCTTTCGC CAAAACTGCC TGACGCTAAA 
GATAAAGAAG AAAGCGTCGC GTAA

Protein sequence

MLNSILVILC LIAVSAFFSM SEISLAASRK IKLKLLADEG NINAQRVLNM QENPGMFFTV 
VQIGLNAVAI LGGIVGDAAF SPAFHSLFSR YMSAELSEQL SFILSFSLVT GMFILFADLT 
PKRIGMIAPE AVALRIINPM RFCLYVCTPL VWFFNGLANI IFRIFKLPMV RKDDITSDDI 
YAVVEAGALA GVLRKQEHEL IENVFELESR TVPSSMTPRE NVIWFDLHED EQSLKNKVAE 
HPHSKFLVCN EDIDHIIGYV DSKDLLNRVL ANQSLALNSG VQIRNTLIVP DTLTLSEALE 
SFKTAGEDFA VIMNEYALVV GIITLNDVMT TLMGDLVGQG LEEQIVARDE NSWLIDGGTP 
IDDVMRVLDI DEFPQSGNYE TIGGFMMFML RKIPKRTDSV KFAGYKFEVV DIDNYRIDQL 
LVTRIDSKAT ALSPKLPDAK DKEESVA