Gene ECH_0193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0193
Symbol
ID	3927694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	184447
End bp	185715
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	32%
IMG OID	637901317
Product	major facilitator family transporter
Protein accession	YP_507017
Protein GI	88657883
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTAA GAAGAGCTGT GTTATCGACA ATCATGTGTA ATACTTTAGT ATGGTATGAT 
TATGTGTTAT TTGGGAATTT GGTGAGTGTA ATCAGTAAAT TATTTTTTCC AGCAGAAGAT 
AGATATTTTA GTCTTATTAT GACATTCAGT ATTTTTGCAG TTGGATTTTT AATGCGTCCT 
TTTGGGGCAA GTATTTTTGG TTACATTGGC GATAAATATG GAAGAAAAGC TGCACTGACT 
TTATCGATTA TAGCAATATC TGTCCCTATT ACTTTTATCT CAATATTGCC TACCTATGAA 
AAAATAGGAA TATTGTCTCC TATATTACTT ATTATTTGTA GGTTGATGCA GGGGATATCT 
CTAGGTGGAG AAGCTGGTAA TGCTACTTTC TTAATAGAGC ATTCTAAAAA GGGAAAAAAC 
ATTGGTTTTT TTGGTAGTTT TGAGACCCTT AGTGCTGTGC TTGGTTCTAT TATTGCATTA 
TTTATGATCT TGTTATCTCA GTACTTTACA GGAGAAAATT TTGAAGTATG GGGTTGGAGA 
ATACCTTTTG TAATTGGTTT ATTATTGGGA TTAATTAGTG TTTATATTAG GCGTATTACT 
GGTGAAAGTC CTGCGTATGA TACTCATAAA GAAAATAATA ATCTTTCTCA ATCTCCTTTC 
TTAGAATTGT TAAAAAAGTA TAAGCGCCCT TTAGTCTTGG CAACATGTAT TGACTGTGTA 
GAAAATTGTT CATTTCATAT TTTTATGGTG TTTTTTATTA CATTTATTAA GGAGTTCTCA 
AATATTCACC TGAATTTAAA TGCTAATACT ATAAGCATTA TTGAAAGTTT TAATATAATG 
ATTTGTGGTA TTTTGAATGT ATTTTTTGGA TATATTTCAG ATTATGTAGG GCGTAGAAAA 
GTAATGTTAA TTGCATCTGT GTCATTGTTT TGTGTTGCAA TACCAGTATT TTGGTTATTA 
AGTCAAGATA GCTATGTTTC TTTGATTGCT GCATATTTAA TATTTGTAAT TCCGTTTTCT 
GCAACTTTAG GTCCAGCAAG TGGTGCAATG TCTGAATTGT TCCCTACAAA AGTTAGATAT 
ACTGGTTTTG GATTATCGCG TAACATTGCT TCAGCTATAT CTGGTGGTAT GGCTCCTGTA 
GTATGTACAT GGCTTATAAG GGCAACAGGG CTTTCGTTTA TTCCTGGAGT ATATGTTATG 
TTTTGGGCAT TGGTTGGAGT TATTGCATTG TGTCAGATCA GAAAAAAAGA TGTTTATGCT 
GATTGGTAA

Protein sequence

MNLRRAVLST IMCNTLVWYD YVLFGNLVSV ISKLFFPAED RYFSLIMTFS IFAVGFLMRP 
FGASIFGYIG DKYGRKAALT LSIIAISVPI TFISILPTYE KIGILSPILL IICRLMQGIS 
LGGEAGNATF LIEHSKKGKN IGFFGSFETL SAVLGSIIAL FMILLSQYFT GENFEVWGWR 
IPFVIGLLLG LISVYIRRIT GESPAYDTHK ENNNLSQSPF LELLKKYKRP LVLATCIDCV 
ENCSFHIFMV FFITFIKEFS NIHLNLNANT ISIIESFNIM ICGILNVFFG YISDYVGRRK 
VMLIASVSLF CVAIPVFWLL SQDSYVSLIA AYLIFVIPFS ATLGPASGAM SELFPTKVRY 
TGFGLSRNIA SAISGGMAPV VCTWLIRATG LSFIPGVYVM FWALVGVIAL CQIRKKDVYA 
DW