Gene RPB_2170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2170
Symbol
ID	3909950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2465193
End bp	2466311
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	637884064
Product	major facilitator transporter
Protein accession	YP_485787
Protein GI	86749291
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0218486
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGGCA ATTTCGTCAC CGGAACCGCG GTTCTGGCGC CGGCCGGCAT GCTCGGCGAA 
TTGTCCCAGG GCCTCGGCGT CAGCATCCGC GACGCCGGCC TTCTGATCAC CTTCGGCGCG 
GTGGTGCTGT GCATCGGCTC GCCGCTGTCG GCGTGGCTGA CCTCTAGGAT CGACCGCCGG 
CTGCTGCTGA CGACGACGCT CTTGGTGCTG GCGCTCGGCA ATCTCGCCTC GGCCTTGGCG 
CCGAACTACG CCGTGTTGCT GGCCCTGCGG ATCGCGATGC TCGCGGTCGG GGCGCTGTAT 
ACGCCACAGG CGGCCGGCGC GGTGGCGCTG CTGGTGGCGC CGGAGAAGCG CGGCGGCACC 
ATGGCCTATG TGTTTCTCGG CTGGTCGCTG GCGGTGGCGC TGGGGGTGCC GATGGTCGCC 
TTCGTCGCCG GCCATTTCGG CTGGCGCGAG GCCTATGGCC TGCTCGGCGC GATCGGCCTG 
ATGTCGTTCG TGCTGCTGTG GGCGCGGCTG CCGGGCGGGC TGCGCGCGAC GCCGGTCGAT 
CTGTCGACCT GGGCCGCGGT CGGGCGCAAC CGCCGGGTTC TCAAGCTGCT CGGCGTGTCG 
TCGCTGCAGA CCTCCGGGCA GTTCGTGGTG TTCACCTATT TCGGGCCGCT GCTGACCGGG 
CTCACCGGCG CCGGCCCCGC CGAGATCGGG CTGGTGTTCG CGCTCTACGG CGTGTTCGGC 
TTCGTCGGCA GCGTGATCGC CAGCCGGATC GTCGACGGCT GGGGCTCCTA CAACACTTCG 
GCGCTGTTCA CCGCCTTCAT GCTCGCCGGC ATCGCCGGCT GGACGTTCGG CGCCGGCCAT 
TTCGCCGTGA TGGCGGCGTC GGTGGCGATC TGGGGGCTGG GCTTCGCGGC GGCGAATTCG 
ATGCAGCAGG TGCGGCTGCT CACCGCCGAT CCGGCGCTGG CGGGCGTCAC CGTGTCGCTC 
AACACCTCGG TGCTGTATGT CGGCCAGGCG ATCGGCTCGG CGATCGGCGG CGCGCTGTTC 
GCGGCCGGCC TGATGCACGT CAACGGCTAC GTCTCGACCG CGGTGATGAC CTGCGCGCTG 
CTCGCGGTGC TGTTCGCGAC GCGGGAGACC AATCGGTAA

Protein sequence

MLGNFVTGTA VLAPAGMLGE LSQGLGVSIR DAGLLITFGA VVLCIGSPLS AWLTSRIDRR 
LLLTTTLLVL ALGNLASALA PNYAVLLALR IAMLAVGALY TPQAAGAVAL LVAPEKRGGT 
MAYVFLGWSL AVALGVPMVA FVAGHFGWRE AYGLLGAIGL MSFVLLWARL PGGLRATPVD 
LSTWAAVGRN RRVLKLLGVS SLQTSGQFVV FTYFGPLLTG LTGAGPAEIG LVFALYGVFG 
FVGSVIASRI VDGWGSYNTS ALFTAFMLAG IAGWTFGAGH FAVMAASVAI WGLGFAAANS 
MQQVRLLTAD PALAGVTVSL NTSVLYVGQA IGSAIGGALF AAGLMHVNGY VSTAVMTCAL 
LAVLFATRET NR