Gene RPD_3638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3638
Symbol
ID	4024152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4061600
End bp	4062580
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	63%
IMG OID	637963842
Product	bile acid:sodium symporter
Protein accession	YP_570762
Protein GI	91978103
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.283342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATAG ACGAATTGCG GGATGTTATG GAAAGCCGTC AGGTCGCCGT GTACTTCGTC 
GCCGTCATCC TTGGCGCGCT GGCAGGGACG CTTTTCAGCG GGACGGAAGC GCTTGAAAGG 
GCCATCAATC CGGCTCTTGC CCTCATGCTG TTCGTGACGT TTCTTCAGGT CCCGGTCGGC 
TCGCTGGGGC AGGCATTTCG CAACGGGCGC TTCTTCGCGG CTCTGCTCCT GACGAATTTC 
GTCGCCGTGC CGGTCCTCGC TGCGGCTATC ATCCCGTTTG CTCCACCCGA CGTCCTTGTT 
CGGATGGGCG TCCTTTTCGT TCTGTTATGC CCTTGCATCG ACTATGTCGT CACTTTCGCG 
CACCTCGGAA GAGGCGATGC CCGGCTCCTG CTGGCCGCTA CACCCGTCTT GCTGGTCGTG 
CAAATGCTGC TGCTGCCGCT GTGGCTTCGT CTCTTTCTGG GAGCGGACGC CGCCCAGTTC 
GTACAGCCTG AGCCGTTCGT GCATGCTTTC GTCTGGCTCA TCGCGATCCC ACTGGGCCTC 
GCGATGGCGT GCCAGCTTTG GGCAGCGCAA AACAAGGCTG GCACTCGCGC CGTAAAAACG 
CTCGGTCTTC TGCCGGTGCC GGCGACGGCG GCGGTCCTAT TCATCGTGAT CGCGGCGGTG 
CTGCCGCAGA TCGGCCCGGC ACAGGCGGCC GTACTCGGTG TCGCACCGCT TTACGTTGTT 
TTCGCGGTGC TGGCCCCGCT GGCCGGCCTG GTCATCGCCC GTATCGCGGG CTTGGAGGCG 
CCCGCCGGTC GCGCCGTAGC GTTCAGCGGT GCCACACGCA ATTCGCTCGT CGTCCTCCCC 
CTTGCGCTCG CCGTGCCGGG TGCCATTCCG ATAATACCGG CTGTCATAGT AGCGCAGACT 
CTGGTGGAGT TGACCGCCTC GCTCGTCTAC ATCCGGCTAA TGCCGCTATT CGGAAGCGAT 
GGCGACGCAG CCGCGCATTA G

Protein sequence

MKIDELRDVM ESRQVAVYFV AVILGALAGT LFSGTEALER AINPALALML FVTFLQVPVG 
SLGQAFRNGR FFAALLLTNF VAVPVLAAAI IPFAPPDVLV RMGVLFVLLC PCIDYVVTFA 
HLGRGDARLL LAATPVLLVV QMLLLPLWLR LFLGADAAQF VQPEPFVHAF VWLIAIPLGL 
AMACQLWAAQ NKAGTRAVKT LGLLPVPATA AVLFIVIAAV LPQIGPAQAA VLGVAPLYVV 
FAVLAPLAGL VIARIAGLEA PAGRAVAFSG ATRNSLVVLP LALAVPGAIP IIPAVIVAQT 
LVELTASLVY IRLMPLFGSD GDAAAH