Gene ECH74115_0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0471
Symbol	araJ
ID	6969012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	476866
End bp	478134
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	51%
IMG OID	643384519
Product	MFS transport protein AraJ
Protein accession	YP_002269033
Protein GI	209397234
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCTTGC TGGTCGTTAT CCTGCAAGCT ATCACTTTAT TGGCTACGGT GATTGGTAGC 
CGTTCTGGTA GTTGTGATGG TGGTATGAAA AAAGTCATTT TATCTTTGGC TCTGGGCACG 
TTTGGTTTGG GGATGGCCGA ATTTGGCATT ATGGGCGTGC TCACGGAGCT GGCGCATAAC 
GTAGGAATTT CGATTCCTGC TGCCGGGCAT ATGATCTCGT ATTATGCGCT GGGGGTGGTG 
GTCGGTGCGC CAATAATCGC ACTCTTTTCC AGCCGCTACT CACTCAAACA TATCTTGTTG 
TTTCTGGTGG CGTTGTGCGT CATTGGCAAC GCCATGTTCA CGCTCTCTTC GTCGTACCTG 
ATGCTTGCCA TTGGTCGCCT GGTTTCCGGC TTTCCGCATG GCGCATTTTT TGGCGTCGGA 
GCGATCGTGT TATCAAAAAT TATCAAACCC GGAAAAGTCA CCGCCGCCGT GGCGGGGATG 
GTTTCCGGGA TGACAGTCGC CAATTTGCTG GGCATTCCGC TGGGAACGTA TTTAAGTCAG 
GAATTTAGCT GGCGTTACAC CTTTTTATTG ATCGCTGTTT TTAATATTGC GGTGATGGCA 
TCGGTCTATT TTTGGGTGCC GGATATTCGC GACGAGGCGA AAGGAAAGCT GCGCGAACAA 
TTTCACTTTT TGCGCAGCCC GGCCCCGTGG TTAATTTTCG CCGCCACCAT GTTTGGCAAC 
GCAGGTGTGT TTGCCTGGTT CAGCTACGTA AAGCCATACA TGATGTTTAT TTCCGGTTTT 
TCGGAAACGG CGATGACCTT TATTATGATG TTAGTTGGGC TAGGGATGGT GCTGGGAAAT 
ATGCTAAGTG GCAGGATTTC AGGACGTTAT TCACCACTGC GCATTGCAGC AGTGACTGAC 
TTTATAATTG TACTGGCACT GCTGATGCTC TTTTTCTGCG GCGGCATGAA AACAACGTCG 
CTTATTTTTG CTTTTATTTG TTGCGCGGGA TTATTTGCCC TTTCAGCACC TCTGCAAATA 
TTGTTACTGC AAAATGCCAA AGGCGGAGAG TTATTAGGTG CCGCAGGTGG GCAAATAGCG 
TTTAACCTCG GTAGCGCCGT CGGCGCATAT TGCGGAGGTA TGATGCTGAC GCTGGGGCTG 
GCATATAATT ACGTGGCGCT GCCTGCCGCC CTGCTTTCGT TTGCTGCGAT GTCATCGTTG 
CTGCTGTATG GTCGCTATAA GCGCCAGCAA GCGGCGGATA GTCCGGTGCT GGCGAAACCA 
CTGGGGTAG

Protein sequence

MALLVVILQA ITLLATVIGS RSGSCDGGMK KVILSLALGT FGLGMAEFGI MGVLTELAHN 
VGISIPAAGH MISYYALGVV VGAPIIALFS SRYSLKHILL FLVALCVIGN AMFTLSSSYL 
MLAIGRLVSG FPHGAFFGVG AIVLSKIIKP GKVTAAVAGM VSGMTVANLL GIPLGTYLSQ 
EFSWRYTFLL IAVFNIAVMA SVYFWVPDIR DEAKGKLREQ FHFLRSPAPW LIFAATMFGN 
AGVFAWFSYV KPYMMFISGF SETAMTFIMM LVGLGMVLGN MLSGRISGRY SPLRIAAVTD 
FIIVLALLML FFCGGMKTTS LIFAFICCAG LFALSAPLQI LLLQNAKGGE LLGAAGGQIA 
FNLGSAVGAY CGGMMLTLGL AYNYVALPAA LLSFAAMSSL LLYGRYKRQQ AADSPVLAKP 
LG