Gene ECH74115_2407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2407
Symbol
ID	6971454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2278519
End bp	2279784
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	46%
IMG OID	643386278
Product	transporter, major facilitator family
Protein accession	YP_002270760
Protein GI	209400911
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.197436
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAAA ATAAGGCTTT CAGCACGCCA TTTATCCTGG CTGTTCTTTG TATTTACTTC 
AGCTACTTCC TGCACGGCAT TAGTGTTATT ACGCTTGCCC AAAATATGTC ATCTCTGGCG 
GAAAAGTTTT CCACTGACAA CGCGGGCATT GCCTACTTAA TTTCCGGTAT CGGTTTGGGG 
CGATTGATCA GTATTTTATT CTTCGGTGTG ATCTCCGATA AGTTTGGTCG TCGGGCGGTG 
ATATTAATGG CAGTAATAAT GTATCTGCTA TTCTTCTTTG GTATTCCCGC TTGCCCGAAT 
TTAACTCTCG CCTACGGTCT GGCAGTGTGC GTAGGTATCG CTAACTCAGC GCTGGATACG 
GGTGGCTACC CCGCGCTCAT GGAATGCTTT CCGAAAGCCT CTGGTTCGGC GGTCATACTG 
GTTAAAGCGA TGGTGTCATT TGGGCAAATG TTCTACCCAA TGCTGGTGAG CTATATGTTG 
CTCAATAATA TCTGGTACGG CTATGGGCTG ATTATTCCGG GTATTCTGTT TGTACTGATC 
ACGCTGATGC TGTTGAAAAG CAAATTCCCC AGCCAGTTGG TGGACGCCAG CGTAGCTAAT 
GAATTACCGC AAATGAACAG CAAACCGTTA GTCTGGCTGG AAGGTGTTTC ATCGGTACTG 
TTCGGTGTAG CCGCATTCTC GACCTTTTAT GTGATTGTGG TGTGGATGCC CAAATATGCG 
ATGGCTTTTG CTGGTATGTC AGAAGCTGAG GCATTAAAAA CCATCTCTTA TTACAGTATG 
GGCTCGCTGG TCTGTGTCTT TATTTTTGCC GCACTACTGA AAAAAATGGT CCGGCCCATC 
TGGGCTAATG TATTTAACTC TGCACTGGCA ACAATAACAG CAGCCATTAT CTACCTGTAC 
CCTTCTCCAC TGGTGTGTAA TGCCGGCGCC TTTGTTATCG GTTTCTCAGC AGCTGGCGGC 
ATTTTACAGC TCGGTGTTTC GGTCATGTCA GAGTTTTTCC CAAAAAGCAA AGCCAAAGTC 
ACCAGTATTT ATATGATGAT GGGTGGACTG GCTAACTTTG TTATTCCGCT GATTACCGGT 
TATCTGTCGA ACATCGGCCT GCAATATATC ATTGTTCTCG ATTTTACTTT CGCGCTGCTG 
GCCCTGATTA CCGCAATTAT TGTTTTTATC CGCTATTACC GCGTTTTTAT TATTCCTGAG 
AATGATGTGC GGTTTGGCGA GCGCAAATTT AGCACCCGGT TAAACACAAT TAAGCATAGA 
GGTTAA

Protein sequence

MSQNKAFSTP FILAVLCIYF SYFLHGISVI TLAQNMSSLA EKFSTDNAGI AYLISGIGLG 
RLISILFFGV ISDKFGRRAV ILMAVIMYLL FFFGIPACPN LTLAYGLAVC VGIANSALDT 
GGYPALMECF PKASGSAVIL VKAMVSFGQM FYPMLVSYML LNNIWYGYGL IIPGILFVLI 
TLMLLKSKFP SQLVDASVAN ELPQMNSKPL VWLEGVSSVL FGVAAFSTFY VIVVWMPKYA 
MAFAGMSEAE ALKTISYYSM GSLVCVFIFA ALLKKMVRPI WANVFNSALA TITAAIIYLY 
PSPLVCNAGA FVIGFSAAGG ILQLGVSVMS EFFPKSKAKV TSIYMMMGGL ANFVIPLITG 
YLSNIGLQYI IVLDFTFALL ALITAIIVFI RYYRVFIIPE NDVRFGERKF STRLNTIKHR 
G