Gene RPD_0489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0489
Symbol
ID	4020957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	563283
End bp	564467
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	69%
IMG OID	637960676
Product	major facilitator transporter
Protein accession	YP_567628
Protein GI	91974969
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCCTGC TCGACCGCAC CGAGGCGCCG GTTCATCCCG CGCGCCTGAT CCTGATCCTG 
TCGCTCGCCC CCACAGTGGG ACTTGGGATC GGCCGCTTCG CCTATTCGCT GCTGCTGCCC 
GACATGCGGG ACAGCCTGCA ATGGTCGTAT TCGGCCGCCG GCTTCATGAA CACCATCAAT 
GCCGCCGGCT ATCTCGCCGG CGCGCTGATC ACCTCGCAGC TGGTTCGGCG TTACGGATTG 
TCGGCGATCG TGCGGGTCGG AACGCTCGGC TGCGTGCTGT CGCTGGCGCT GTGTGCGCTG 
TCGGGCAATT TCGTGCTGCT GTCGGCGGCG CGGCTGATCG CCGGGATCGG CGCGGCGCTG 
GCTTTCGTCG CCGGCGGAGC GCTGGCGACC ACGATCGCGC AGTCGCAGCC ACAGCGCTCG 
GCGTTTCTGC TCAGCCTGTT CTATGCCGGC CCCGGCCTCG GCATCCTGTC GTCGGGGCTG 
ATCACCCCGT TTCTGTTGCA GGCGGCGGGC CCCGGCTCGT GGTGGATCGG CTGGCTGGTG 
ATGGCGGCGC TGTCGGCCGT GATGACGCTG CCGCTTCTGC TCGCGCCGCT CGACAGCCAT 
GCCAGCATGA GCGGCGGACC GGCGACGACA TTCTCGATCC GGCCGGTGCT GATCTATCTG 
GTCGGCTATT TCATGTTCGG CGCCGGCTAC ATCGCCTACA TGACCTTCAT GATCGCCTAT 
GTGCGCGACG CTGGCGGCGG ACCGGCGGCG CAGAGCGCGT TCTGGTGCCT GATCGGGGCG 
AGCGCCTTCG TCACCCCGTG GGTGTGGCGC CGGATCATGG CGCTCGACCG CGGCGGGGTG 
TCGACCACGA TCATCCTCGC CGTCAACGCG CTCGGCGCGG CGCTGCCGCT GTTCGGACTG 
TCGCCGCTGA TCCTGGCGAT CTCGGCGCTG GTGTTCGGCG TGTCGTTCTT CGCCGTGGTG 
GCGTCGACCA CCGCCTTCGT CCGCTTCAAT TATGCGCAGG CGGCGTGGCC GGGCGCGATC 
GCCGCGATGA CGATTGCGTT CGGGATCGGC CAGACGCTGG GCCCCCTTGC GGTCGGCGCC 
ATCACCGACG CAGTCGGCAG CCTGTCCTCG GCGCTCGCGG TCTCCGCCGC CACACTGGCG 
CTCGGCGCGG TGTTCTCGGC ATTTCAGCGG CCGTTGAAAC GGTAG

Protein sequence

MTLLDRTEAP VHPARLILIL SLAPTVGLGI GRFAYSLLLP DMRDSLQWSY SAAGFMNTIN 
AAGYLAGALI TSQLVRRYGL SAIVRVGTLG CVLSLALCAL SGNFVLLSAA RLIAGIGAAL 
AFVAGGALAT TIAQSQPQRS AFLLSLFYAG PGLGILSSGL ITPFLLQAAG PGSWWIGWLV 
MAALSAVMTL PLLLAPLDSH ASMSGGPATT FSIRPVLIYL VGYFMFGAGY IAYMTFMIAY 
VRDAGGGPAA QSAFWCLIGA SAFVTPWVWR RIMALDRGGV STTIILAVNA LGAALPLFGL 
SPLILAISAL VFGVSFFAVV ASTTAFVRFN YAQAAWPGAI AAMTIAFGIG QTLGPLAVGA 
ITDAVGSLSS ALAVSAATLA LGAVFSAFQR PLKR