Gene EcE24377A_1612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1612
Symbol
ID	5589023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1604879
End bp	1606147
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	52%
IMG OID	640925300
Product	benzoate transporter
Protein accession	YP_001462705
Protein GI	157156433
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.795088
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTCC TCCGGCAAAA CGGAAGTTTA TCACTTGTGC GTTATAACGG ACAAATGCTA 
CGGTGCCTGT ACGCTATAAC GCACGAGGTG ACTATGCGTC TGTTTTCTAT TCCTCCACCC 
ACGCTACTGG CGGGGTTTCT GGCGGTATTA ATTGGCTACG CCAGTTCAGC GGCAATAATC 
TGGCAAGCAG CGATTGTCGC CGGAGCCACC ACTGCACAAA TCTCTGGCTG GATGACGGCG 
CTGGGGCTGG CAATGGGCGT CAGTACGCTG ACTCTGACAT TATGGTATCG CGTACCTGTT 
CTCACCGCAT GGTCAACGCC TGGCGCGGCT TTGTTGGTCA CCGGATTGCA GGGACTAACA 
CTTAACGAAG CCATCGGCGT TTTTATTGTC ACCAACGCGT TAATAGTCCT CTGCGGCATA 
ACGGGACTCT TTGCTCGTCT GATGCGCATT ATTCCGCACT CGCTTGCGGC GGCAATGCTT 
GCCGGGATTT TATTACGCTT TGGTTTACAG GCGTTTGCCA GTCTGGACGG TCAATTTACG 
TTGTGTGGAA GTATGTTGCT GGTATGGCTG GCAACCAAGG CCGTTGCGCC GCGCTATGCG 
GTAATTGCCG CGATGATTAT TGGGATCGTG ATCGTTATCG CGCAAGGTGA CGTTGTCACA 
ACTGATGTTG TCTTTAAACC CGTTCTCCCC ACTTATATTA CCCCTGATTT TTCGTTTGCT 
CACAGCCTGA GCGTTGCACT CCCCCTTTTT CTGGTGACGA TGGCATCGCA AAACGCACCG 
GGTATCGCAG CAATGAAAGC AGCCGGGTAT TCGGCTCCTG TTTCGCCATT AATTGTATTT 
ACTGGATTGC TGGCACTGGT TTTTTCCCCT TTCGGCGTTT ATTCCGTCGG TATTGCGGCA 
ATCACCGCGG CTATTTGCCA AAGCCCGGAA GCGCATCCGG ATAAAGATCA ACGTTGGCTG 
GCAGCTGCCG TTGCAGGCAT TTTTTATTTG ATCGCAGGTC TGTTTGGTAG TGCTATTACC 
GGGATGATGG CTGCCCTGCC CGTAAGTTGG ATCCAGATGC TGGCAGGTCT GGCGCTGTTA 
AGTACCATTA GCGGCAGTTT GTATCAGGCG CTGCATAATG AGCGTGAGCG AGACGCGGCG 
GTGGTGGCAT TTCTGGTAAC GGCAAGTGGA TTGACGCTGG TCGGGATTGG TTCTGCGTTC 
TGGGGATTAA TTGCCGGAGG CGTTTGTTAC GTGGTGTTGA ATTTAATCGC TGACAGAAAC 
CGATATTGA

Protein sequence

MRLLRQNGSL SLVRYNGQML RCLYAITHEV TMRLFSIPPP TLLAGFLAVL IGYASSAAII 
WQAAIVAGAT TAQISGWMTA LGLAMGVSTL TLTLWYRVPV LTAWSTPGAA LLVTGLQGLT 
LNEAIGVFIV TNALIVLCGI TGLFARLMRI IPHSLAAAML AGILLRFGLQ AFASLDGQFT 
LCGSMLLVWL ATKAVAPRYA VIAAMIIGIV IVIAQGDVVT TDVVFKPVLP TYITPDFSFA 
HSLSVALPLF LVTMASQNAP GIAAMKAAGY SAPVSPLIVF TGLLALVFSP FGVYSVGIAA 
ITAAICQSPE AHPDKDQRWL AAAVAGIFYL IAGLFGSAIT GMMAALPVSW IQMLAGLALL 
STISGSLYQA LHNERERDAA VVAFLVTASG LTLVGIGSAF WGLIAGGVCY VVLNLIADRN 
RY