Gene RPC_1931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1931
Symbol
ID	3973563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2102321
End bp	2103313
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	66%
IMG OID	637925042
Product	ABC sulfate transport system, periplasmic binding protein
Protein accession	YP_531807
Protein GI	90423437
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.10366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCCG TTGCGACACG CCGCTCACTC ATGGTCGGAC TAGGCTCCTT GGCGCTGGCC 
GGCTTGGCGC CGCGTCGCGC ATTGTCCACG CCGTCCCGCG GGCTGCAGAT TTTGGGAGCA 
CCGAACGGCT CGACCGTCGT GCTGGTCGAT CTGATCGAAT CCGGGGCGCT GGCGGCGGCG 
GCGCCGGACG TGAGCTTCCG GCTGTGGCGA ACCACCGACG ATCTGCGCGC CGGCATCGTC 
TCCGGCAATA CCAAGATCTT TTCGACGCCG AGCCATGTGC CCGCCAACCT CGCGAGCCGC 
GGCATGCCGC TGAAGATGCT TTGCCTGCTC GGCATGGGGC ATCTGTCGGT GATCACCAGC 
GACGACAGCA TCCGGGATTT TCATGACCTG GCCGGCAAGC CGATGCTCGG CTTCTTCCGC 
AACGACATGC CGGATTTGAC CTTCCGGGCG ATCGCAAAAA TGGAAGGGCT CGATCCCGAC 
AAGGACATTC AGCTGAGCTA CGTGCAAACC GCGATGGAAG CCGCGCAGAT GCTCGCCGCC 
GGCCGCGCCA CCACCGCGAT CCTGTCCGAG CCGCCGGCCA CCGCCGCCAT GGTGATGGCC 
GCGCAGCAGG AGCGCAAATT GCGTCGCGCC TTCGAACTCA CCACGATCTG GGGCCGACAC 
AAGCCGAAGC CGCGGATTCC GATGGCGGGG ATCGCGCTGC ATGCCAGCCT GCTCGACGAC 
GCGCCGGATT TGGTTGCAGC ATTGCGTGCC GGGCTGTTGC CGGCCAAGCA GCGCGTGCTG 
GCCGATCCCG CGGCGGCGGC GAAGCTCGCC GAACGCCGCA TGGAGATGCG GCCGCAGATT 
TTTGAGAAGG CGTTTCCCTA TATGCATATC GACGTGGTGT CGGCGAAGGA GGCCAAGGCC 
GAACTGATCG ACTTCTACAC CACGCTGCTC GCGCTCGAGC CGGAAGCGCT CGGCGGCAAG 
CTGCCGCCCG ACGATTTCTA TCTCGACCTC TGA

Protein sequence

MPAVATRRSL MVGLGSLALA GLAPRRALST PSRGLQILGA PNGSTVVLVD LIESGALAAA 
APDVSFRLWR TTDDLRAGIV SGNTKIFSTP SHVPANLASR GMPLKMLCLL GMGHLSVITS 
DDSIRDFHDL AGKPMLGFFR NDMPDLTFRA IAKMEGLDPD KDIQLSYVQT AMEAAQMLAA 
GRATTAILSE PPATAAMVMA AQQERKLRRA FELTTIWGRH KPKPRIPMAG IALHASLLDD 
APDLVAALRA GLLPAKQRVL ADPAAAAKLA ERRMEMRPQI FEKAFPYMHI DVVSAKEAKA 
ELIDFYTTLL ALEPEALGGK LPPDDFYLDL