Gene RPC_0089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0089
Symbol
ID	3971347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	100508
End bp	101728
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	70%
IMG OID	637923205
Product	major facilitator transporter
Protein accession	YP_529987
Protein GI	90421617
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGACG CAATCATGAT CGACGAAGCC GCCGGCGATG CGCGGGCGCG GTCGAACCTG 
TTGCGGCTCG GCATCGCCCA GGCGCTGACC GGCGCCAACG CCGCGGTGAT CTTCGCCACC 
GGCGCGATCG TCGGCGCCAC GCTGGCGCCC GACGCCACCT TCGCCACACT GCCGGTGTCG 
GTCTATGTGG TCGGCATGGC GGCCGGCACG CTGCCGACCG GGGCGATCTC GCGGGCGTTC 
GGCCGCCGTG TCGCCTTCCT GCTCGGCGGC GGCTGCGGCG CGCTGTGCGG AGCGCTGGCC 
TGCCTCGCCA TCCTGCACGG CTCGTTCGCG CTGTTTTGCG TCGCCACCTT CCTCGGCGGG 
CTCTACGGCG CGGTGGCGCA ATCCTATCGC TTCGCCGCCG CCGACGGCGC CAGCGTGGCG 
TTTCGGTCGC GCGCGATTGG CTGGGTGATG ACCGGCGGCA TCTTTGCCGG CGTGATCGGT 
CCGCAGCTGG TGCAATGGAC CATGGATATC TGGCCACCCT ATCTGTTCGC CTTCAGCTTC 
GCCACCCAGG CCGTGGTGGC GCTGATCGCG ATGGCGGTGT TGGCCGGGGT CGACGCGCCG 
CGGCCAAAGC CCGCCGAACT CGCCGGCGGC CGGCCGCTGT GGCAGATCGC CCGGCAGCCG 
CGCTTCGTCA TCGCGGTGGT GTGCGGCGTG GTGTCCTACG CGATGATGAA CCTGGTGATG 
ACTTCGGCGC CGCTGGCGAT GCAGATGTGC GGCTTGTCGA TCAGCGATTC CAACACCGGG 
ATTCAGTGGC ACATGGTGGC GATGTATGGC GCGAGTCTGC TGGCCGGGCC GATGATCGCC 
CGGTTCGGCG CCGCGCGCAC CGCGGCGCTC GGGCTCGTGC TGGAAGCGCT CGCCGCCTGC 
ATCGACCTGT CCGGCGTCAC CGCGCTGCAT TTCTGGGCCG GGCTGATCGC GCTCGGCATC 
GGCTGGAATT TCGGCTTCGT CGGCGCCTCG GCGCTGGTGC TGGAAACCCA CCTGCCGGCG 
GAGCGCAACA AGGTGCAGGC GTTGAACGAT TTCCTGGTGT TCGGGGTGAT GGCGCTGGGC 
TCGTTCGCCT CCGGCGGCGT GCTGGCGCTG TACGGCTGGT CGACCATCAA CTGGGTGGTG 
TTTCCGCCGG TGCTGCTGGC GCTGGCGGTG CTGGCGTTCG CGACCTGGGG CCAACGGCGA 
GCGGTGCCGC GCGGTTCGTG A

Protein sequence

MVDAIMIDEA AGDARARSNL LRLGIAQALT GANAAVIFAT GAIVGATLAP DATFATLPVS 
VYVVGMAAGT LPTGAISRAF GRRVAFLLGG GCGALCGALA CLAILHGSFA LFCVATFLGG 
LYGAVAQSYR FAAADGASVA FRSRAIGWVM TGGIFAGVIG PQLVQWTMDI WPPYLFAFSF 
ATQAVVALIA MAVLAGVDAP RPKPAELAGG RPLWQIARQP RFVIAVVCGV VSYAMMNLVM 
TSAPLAMQMC GLSISDSNTG IQWHMVAMYG ASLLAGPMIA RFGAARTAAL GLVLEALAAC 
IDLSGVTALH FWAGLIALGI GWNFGFVGAS ALVLETHLPA ERNKVQALND FLVFGVMALG 
SFASGGVLAL YGWSTINWVV FPPVLLALAV LAFATWGQRR AVPRGS