Gene ECH74115_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2034
Symbol	tehA
ID	6970361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1932672
End bp	1933664
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	53%
IMG OID	643385948
Product	potassium-tellurite ethidium and proflavin transporter
Protein accession	YP_002270437
Protein GI	209396012
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1275] Tellurite resistance protein and related permeases
TIGRFAM ID	[TIGR00816] C4-dicarboxylate transporter/malic acid transport protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00204759
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	5.87722e-19
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGAGCG ATAAAGTGCT CAATTTGCCG GCAGGCTACT TTGGTATTGT GTTGGGGACG 
ATAGGGATGG GATTTGCCTG GCGCTATGCC AGCCAGGTTT GGCAGGTCAG CCACTGGTTA 
GGGGATGGGC TGGTGATTCT GGCGATGATC ATCTGGGGAT TATTGACTAG CGCATTTATT 
ACCCGACTCA TACGCTTTCC GCATAGCGTG CTGGCGGAAG TTCGCCATCC AGTGCTGAGC 
AGTTTTGTGA GTTTGTTTCC TGCAACGACG ATGCTGGTGG CGATTGGTTT TGTTCCGTGG 
TTTCGCCCAC TGGCGGTGTG CCTGTTCAGT TTTGGTGTCG TGGTTCAGTT GGCTTATGCC 
GCCTGGCAAA CTGCGGGATT ATGGCGCGGA TCTCACCCTG AAGAAGCTAC TACGCCTGGA 
CTGTATCTGC CGACAGTTGC CAACAACTTT ATCAGCGCAA TGGCCTGTGG TGCGTTGGGC 
TACACCGACG CCGGTCTGGT GTTTTTAGGC GCAGGCGTTT TCTCATGGCT AAGCCTTGAA 
CCGGTGATCT TGCAGCGTCT GCGTAGTTCG GGAGAATTAC CCACGGCACT GCGGACATCA 
CTCGGCATTC AGCTCGCTCC TGCGCTGGTG GCCTGTAGTG CCTGGCTGAG CGTCAACGGC 
GGCGAGGGTG ACACGCTGGC GAAAATGCTT TTCGGTTATG GACTGCTGCA ACTGCTGTTT 
ATGCTACGTC TGATGCCATG GTATCTCTCC CAGCCATTTA ATGCTTCATT CTGGAGTTTC 
TCGTTCGGCG TATCTGCACT GGCAACCACC GGTTTGCATC TGGGGAGTGG CAGCGATAAT 
GGATTTTTCC ATACGCTGGC GGTGCCGCTG TTTATCTTTA CCAATTTTAT TATTGCAATA 
CTGCTCATCC GTACTTTGGC GCTTCTGATG CAGGGAAAAT TGTTAGTCAG AACCGAGCGC 
GCCGTTTTAA TGAAAGCAGA GGACAAAGAA TGA

Protein sequence

MQSDKVLNLP AGYFGIVLGT IGMGFAWRYA SQVWQVSHWL GDGLVILAMI IWGLLTSAFI 
TRLIRFPHSV LAEVRHPVLS SFVSLFPATT MLVAIGFVPW FRPLAVCLFS FGVVVQLAYA 
AWQTAGLWRG SHPEEATTPG LYLPTVANNF ISAMACGALG YTDAGLVFLG AGVFSWLSLE 
PVILQRLRSS GELPTALRTS LGIQLAPALV ACSAWLSVNG GEGDTLAKML FGYGLLQLLF 
MLRLMPWYLS QPFNASFWSF SFGVSALATT GLHLGSGSDN GFFHTLAVPL FIFTNFIIAI 
LLIRTLALLM QGKLLVRTER AVLMKAEDKE