Gene RPD_4386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4386
Symbol
ID	4024911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4852104
End bp	4853321
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	69%
IMG OID	637964596
Product	major facilitator transporter
Protein accession	YP_571504
Protein GI	91978845
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.185131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCA TCCCGCCGGA TGACGAGACC TCGATCCGCT ATGGCGGCTG GCGCATCGTT 
GCGGTGTGCT TTGCGGTCGC AACCTTCGGC TGGGCTTTCG GGTTCTATGG CCAGAGCGTC 
TATCTCGCCG AGCTCACGCG CCTGCATGGC TGGCCGTCGT CGCTGATCGC CACCGCGACG 
ACTTTCTTTT ATCTCGGCGG CGCGCTGCTG GTCGCCTTTG TGGGCGACGC GATCCGGATG 
ATCGGCGCGC GCGCGTGCCT GCTCGGCGGC ATCGCCGCGA TGGCGCTCGG CACCGCGCTG 
CTCGGCCGGA TCGATGCGCT GTGGCAGCTT TATGCCGTCT ACGTGCTGCT CGCGATCGGC 
TGGGCCGGCA CCAGTCTCGG CGCGGTTACC AGCACGCTCG GCCTGTGGTT CGACCAGCGC 
CGTGGCATGG CGATCAGCCT GGCGTTGAAC GGCGCGAGTT TCGGGGGCAT TGCCGGCGTG 
CCGCTGTTGG TGGCGGCGAT CGAACATCTC GGTTTCGCCG GCGCCACGCT CGCGGCGGCG 
GTCGTGTCCG TCGTCGTGCT GATGCCGATC GTGGCGATCT TCGTCGGCCG CCCGCCGCAG 
CGCGCCGCTG CTCACGCTGC CGGGCCGGGT GCGGTGCAGG CCCTGTCGTC GGGCGCGATC 
CGCCGGCATG CGTTCCGCGA CACCGCGTTC CTCACCGTCA CGATCGCCTT CGCGCTGGTG 
CTGTTCGCGC AGGTCGGGTT CATCGTGCAC CTGATCGCCT ATCTCGATCC GCTGGTCGGC 
CGCGAGCGCG CCGCGGTCGC GGTGTCGTTG CTGACGACGA TGGCGGTGGT CGGCCGCGTG 
TCGCTGTCGA CCGTGATCGA TCGCCTCGAC CAGCGGCTGG TCTCGGCGAT CTCGTTTGCG 
AGCCAGGCGG CGGCGCTGGC GATCGTGATC CTGTCGCGCG ACGCCACGCT GCTGCTGGTC 
GCTTGCGCGC TGTTCGGCTT CTCGGTCGGC AATCTGATCA CGCTGCCGGC GCTGATCGTG 
CAGCGCGAAT TCGCTCCCGG CTCGTTCGGC GTGCTGGTCA GCCTCAACAC CGCGATCAAT 
CAGGTGACCT ACGCGTTCGG CCCGGGGGTG GTCGGCCTCC TCCGCGACGC TTCCGGCAGC 
TACACGGCGC CGTTCCTCGG CTGCATCGCG CTACAACTGA TCGCCGCCAT GCTGGTGATG 
GTGCGGGGGC GGAGCTAG

Protein sequence

MAAIPPDDET SIRYGGWRIV AVCFAVATFG WAFGFYGQSV YLAELTRLHG WPSSLIATAT 
TFFYLGGALL VAFVGDAIRM IGARACLLGG IAAMALGTAL LGRIDALWQL YAVYVLLAIG 
WAGTSLGAVT STLGLWFDQR RGMAISLALN GASFGGIAGV PLLVAAIEHL GFAGATLAAA 
VVSVVVLMPI VAIFVGRPPQ RAAAHAAGPG AVQALSSGAI RRHAFRDTAF LTVTIAFALV 
LFAQVGFIVH LIAYLDPLVG RERAAVAVSL LTTMAVVGRV SLSTVIDRLD QRLVSAISFA 
SQAAALAIVI LSRDATLLLV ACALFGFSVG NLITLPALIV QREFAPGSFG VLVSLNTAIN 
QVTYAFGPGV VGLLRDASGS YTAPFLGCIA LQLIAAMLVM VRGRS