Gene RPB_4678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4678
Symbol
ID	3912496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	5291396
End bp	5292610
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	69%
IMG OID	637886583
Product	major facilitator transporter
Protein accession	YP_488272
Protein GI	86751776
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAACC TTCCGCTGCG CGACGAGAGT TCGATTCGCT ATGAAGGCTG GCGGATCGTC 
GCGATGTGTT TTGCGGTCGC GACCTTCGGC TGGGCGCTCG GCTTCTACGG CCAGAGCGTC 
TATCTCGCCG AGCTGACGCG GCTGCACGGC TGGCCGTCGT CGCTGATCGC GACCGCGACG 
ACGTTCTTCT ATCTCGGCGG CGCGCTGCTG GTCGCCTTCG TCGGCGACGT CATCCGCGTG 
ATCGGGCCGC GCGCCTGTCT GCTCGGCGGC ATCGCCGCGA TGGCGCTCGG CACCGCGCTG 
CTCGGCCGGA TCGATGCGGT CTGGCAGCTC TACGCCGTCT ATGTGCTGCT CGCGGTCGGT 
TGGGCCGGCA CCAGCCTCGG CGCCATCACC AGCACGCTCG GGCTGTGGTT CGACCGGCGC 
CGCGGCATGG CGATCAGCCT GGCGCTGAAC GGCGCCAGCT TCGGCGGCAT CGCCGGCGTG 
CCGTTGCTGG TCGCGGCGAT CGGACATTTC GGATTTGCCG ACGCGACGCT GGCGGCGGCG 
ATCGCCGGGG TATTGCTGAT GCCGGTCGTC GCGATCGTCG TCGGCCGCCC GCCGCTGCGC 
ATCGCGGAGC ATCCCGCCGG GCCGGGTGCG GTGCAGGCGC TGTCGTCGGG CGCGATCCGC 
CGCGATGCGT TCCGCGACAT TGCGTTCCTC ACCGTCACCA TCGCGTTCGC GCTGGTGCTG 
TTCGCGCAGG TCGGCTTCAT CGTGCACTTG ATCGCCTATC TCGACCCGTT GATCGGCCGC 
GAGCGCGCCG CAGCCGCGGT GGCGCTGCTG ACCACGATGG CGGTGGTCGG CCGCGTCTCG 
TTGTCGACCG TGATCGACCG GCTCGACCAG CGGCTGGTGT CGGCGATCTC GTTCCTGAGC 
CAGGCGGTGG CGCTGGCGAT CGTGATCCTG TCGCGCGACG GCACGCTGCT ATTGATCGCC 
TGTGCGCTGT TCGGCTTCTC GGTCGGCAAT CTGATCACGT TGCCGGCGCT GATCGTGCAG 
CGCGAATTCC CGGCCGCCTC GTTCGGCGTC CTGATCAGCC TCGTCACCGC GATCAATCAG 
GTGACCTATG CGTTCGGCCC CGGCGTGATC GGCCTCGTCC GCGACCTCTC CGGCAGTTAC 
ACGCTACCGT TCGCCGGCTG CATCGTGCTG CAACTGATCG CCGCGGCGCT GGTGATGATG 
CGGGGACGAA GCTGA

Protein sequence

MVNLPLRDES SIRYEGWRIV AMCFAVATFG WALGFYGQSV YLAELTRLHG WPSSLIATAT 
TFFYLGGALL VAFVGDVIRV IGPRACLLGG IAAMALGTAL LGRIDAVWQL YAVYVLLAVG 
WAGTSLGAIT STLGLWFDRR RGMAISLALN GASFGGIAGV PLLVAAIGHF GFADATLAAA 
IAGVLLMPVV AIVVGRPPLR IAEHPAGPGA VQALSSGAIR RDAFRDIAFL TVTIAFALVL 
FAQVGFIVHL IAYLDPLIGR ERAAAAVALL TTMAVVGRVS LSTVIDRLDQ RLVSAISFLS 
QAVALAIVIL SRDGTLLLIA CALFGFSVGN LITLPALIVQ REFPAASFGV LISLVTAINQ 
VTYAFGPGVI GLVRDLSGSY TLPFAGCIVL QLIAAALVMM RGRS