Gene RPC_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4020
Symbol
ID	3969210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4469269
End bp	4470141
Gene Length	873 bp
Protein Length	290 aa
Translation table	11
GC content	67%
IMG OID	637927124
Product	Sulfate ABC transporter, permease protein CysW
Protein accession	YP_533865
Protein GI	90425495
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4208] ABC-type sulfate transport system, permease component
TIGRFAM ID	[TIGR00969] sulfate ABC transporter, permease protein [TIGR02140] sulfate ABC transporter, permease protein CysW

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.144703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.19248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAC AGCCGCAGCC TCCGATCAGA AAGACCGACT GGATGGTGAC GCCGGTCGGC 
GCCGGCCCGG TCGCCCGCCG CGTCGTCTTA AGCATCGTCG GCGTCACCAC GGCGCTGTTC 
CTGCTGGCGC CGCTGGCGCT GATCGTCGCT TCGGCGTTCT CGCAAGGCGC CGGCGTGTTC 
TTCCGCAGCC TCGGCGATCC GGGAACGCTG CACGCCATCA AGCTGACGCT GATCACCGCG 
GCGATCGCGG TGCCGATGAA CATCCTGTTC GGCCTCGCCG CGGCCTGGAC CGTGACCAAA 
TTCGTCTTCC CCGGCCGCAC CTTGCTGATC GCGCTGATCG AACTGCCGTA TTCGATTTCG 
CCGATCGTCG CCGGCGTGGC GTTCCTTTTC GTCTACGGCT CGCAGGGGCT GTTCGGGCCA 
CTCCTGGAGC AGCTCGGCCT CAAGGTGATG TTCGCGCTGC CGGCGATCGT GCTCGCCAGC 
ATGTTCGTCA CCGCGCCGTT CGTGGCGCGC GAGCTGATCC CGTTGATGCA GGTGCAGGGC 
ACCGACGAGG AGGAAGCCGC GGTGACGCTC GGCGCCTCCG GCTTTGCGAC TTTCGTCCGG 
GTGACGCTGC CGAATATCCG CTGGGCGGTG CTGTACGGCG CCATCCTCTG CAACGCGCGG 
GTGATGGGCG AATTCGGCGC GGTGTCGGTG GTGTCGGGCA ATATCCGCGG CCAGACCACC 
ACGCTGCCGC TGCAGATCGA ACTTTTGTAC CAAGACTACA ACGTCGCCGG CGCCTTCGCC 
GCAGCCACTG TGCTCACCGC GGTGGCGCTG TTGACCATCG TCATCAAGGC GGGGCTGGAG 
CGGCTGGCCC GGGTCGAACA GGTCCAGCCC TGA

Protein sequence

MTKQPQPPIR KTDWMVTPVG AGPVARRVVL SIVGVTTALF LLAPLALIVA SAFSQGAGVF 
FRSLGDPGTL HAIKLTLITA AIAVPMNILF GLAAAWTVTK FVFPGRTLLI ALIELPYSIS 
PIVAGVAFLF VYGSQGLFGP LLEQLGLKVM FALPAIVLAS MFVTAPFVAR ELIPLMQVQG 
TDEEEAAVTL GASGFATFVR VTLPNIRWAV LYGAILCNAR VMGEFGAVSV VSGNIRGQTT 
TLPLQIELLY QDYNVAGAFA AATVLTAVAL LTIVIKAGLE RLARVEQVQP