Gene RPB_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1972
Symbol
ID	3909477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2238228
End bp	2239280
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	66%
IMG OID	637883866
Product	bile acid:sodium symporter
Protein accession	YP_485591
Protein GI	86749095
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCT TCGAACGCTA TCTGACGCTG TGGGTCGCGC TGTGCATCGC CGTCGGCATC 
GGGCTCGGCC ATGTCGTGCC CGGCCTGTTC CAGGCGGTCG CCGCCGCCGA GATCGCCAAG 
GTCAATCTGC CGGTGGCGGT GCTGATCTGG CTGATGATCA TTCCGATGCT GGTGAAGATC 
GATTTCGCCG CGCTGGCGCG GGTGCGCGAG CATTGGCGCG GCATCGGCGT GACGCTGTTC 
ATTAACTGGG CGGTGAAGCC GTTCTCGATG GCGGCGCTGG CCTGGCTGTT CATCGGCTGG 
CTGTTCAGGG ATCATCTGCC GGCCGATCAG ATCAATTCCT ACATCGCCGG GCTGATCATT 
CTGGCCGCGG CGCCGTGCAC CGCGATGGTG TTCGTGTGGT CGAACCTGAT CAAAGGCGAG 
CCGCATTTCA CGCTGAGCCA GGTAGCGCTG AACGACACCA TCATGGTGTT CGCCTTCGCG 
CCGATCGTCG GCCTGCTGCT CGGCCTGTCG GCGATCACCG TGCCGTGGGA CACGCTGATG 
ATCTCGGTGG CGCTGTACAT CGTGGTGCCG GTGATCATCG CGCAAATGCT GCGGCGGCGG 
GTGCTGGCGG CCGGCGGCGA GGCGGGATTG CAGCGCTTGC TCGGCGCGGT TCAGCCGCTG 
TCGCTGGTCG CCTTGCTGGC GACGCTGGTG CTGCTGTTCG GCTTCCAGGG CGAGCAGATC 
ATCCGGCAGC CGCTGGTGAT CGCGCTGCTC GCGGTGCCGA TCCTGATCCA GGTGTATTTC 
AACGCCGGGC TCGCTTATCT GCTCAATCGC CTGAGCGGCG AGCAGCATTG CGTCGCGGGT 
CCCTCGGCGC TGATCGGCGC CAGCAACTTC TTCGAACTCG CGGTGGCCGC CGCGATCAGC 
CTGTTCGGCT TCGAATCCGG CGCGGCGCTG GCCACCGTGG TCGGCGTGCT GATCGAGGTG 
CCGGTGATGC TGACGGTGGT GTGGATCGTC AACCGCTCCA AGGGCTGGTA CGAGGGCGAG 
GCGCGCGCCG CCGTCACGAC CCGGCCGGGT TAG

Protein sequence

MSTFERYLTL WVALCIAVGI GLGHVVPGLF QAVAAAEIAK VNLPVAVLIW LMIIPMLVKI 
DFAALARVRE HWRGIGVTLF INWAVKPFSM AALAWLFIGW LFRDHLPADQ INSYIAGLII 
LAAAPCTAMV FVWSNLIKGE PHFTLSQVAL NDTIMVFAFA PIVGLLLGLS AITVPWDTLM 
ISVALYIVVP VIIAQMLRRR VLAAGGEAGL QRLLGAVQPL SLVALLATLV LLFGFQGEQI 
IRQPLVIALL AVPILIQVYF NAGLAYLLNR LSGEQHCVAG PSALIGASNF FELAVAAAIS 
LFGFESGAAL ATVVGVLIEV PVMLTVVWIV NRSKGWYEGE ARAAVTTRPG