Gene RPB_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1047
Symbol
ID	3908899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1203970
End bp	1204890
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	66%
IMG OID	637882940
Product	sulfate ABC transporter, permease protein CysW
Protein accession	YP_484668
Protein GI	86748172
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4208] ABC-type sulfate transport system, permease component
TIGRFAM ID	[TIGR00969] sulfate ABC transporter, permease protein [TIGR02140] sulfate ABC transporter, permease protein CysW

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTGG TCGCGACCAC ATCCGTGAGG CGCTCCCCGC GCAAGCCTGC CGTCGCGGCC 
GGCGCACGTG CCGGGCAGCC GGCGCGGCGC CCGGCGCATG GCGAGCCGGC CTGGGTGCGC 
CTGCTGATCA TCGGCTTCGC CGTGAGTTTT CTCACCGTCT TCGTGGTGCT GCCGCTGATC 
CTGGTGTTCT CGGAGGCGCT GTCGAAGGGC GTCTCGTTCT ATCTCGACGC GCTGGCGGGA 
GACGAAGCGC TGGCGGCGAT CCGGCTGACG CTGGTCGCGG CGGCGATCTC GGTCGGGCTC 
AATCTGGTGT TCGGCGTGAT CGCCGCCTGG GCGATCGCGA AGTTCGAGTT TCGCGGCAAG 
ACGCTGCTGA TCACGCTGAT CGATCTGCCG TTCTCGGTCA GCCCGGTGAT CTCCGGCCTG 
GTATTCGTGC TGCTGTTCGG CGCGCAGGGC TTTGTCGGCC CGTGGCTGAT GGCCCACGAC 
GTGCGAATCC TGTTCGCGCT GCCGGCGATC GTGCTGGCGA CCACCTTCGT GACCTTCCCG 
TTCGTCGCGC GCGAACTGAT CCCGCTGATG CAGGAGCAGG GCCAGCACGA GGAAGAAGCC 
GCGATCTCGC TCGGCGCCAG CGGCTGGAAA ACCTTCTGGC GGGTGACGCT GCCGAACATC 
AAATGGGGCC TGCTGTACGG CGTGCTGCTG TGCAATGCGC GGGCGATGGG CGAGTTCGGC 
GCGGTGTCGG TGGTGTCGGG TCACATCCGC GGCGAGACCA ACACCATGCC GCTGCTGGTC 
GAAATTCTCT ACAACGAGTA TCAGATGGTC GCCGCCTTCG CGATCGCCTC GCTGCTGGCG 
CTGCTGGCGC TGGTGACGCT GATCGTCAAG ACCATCTTGG AAGGCCGTAT CGAGGAAGGG 
CTGCACACCG ATGACCATTG A

Protein sequence

MTLVATTSVR RSPRKPAVAA GARAGQPARR PAHGEPAWVR LLIIGFAVSF LTVFVVLPLI 
LVFSEALSKG VSFYLDALAG DEALAAIRLT LVAAAISVGL NLVFGVIAAW AIAKFEFRGK 
TLLITLIDLP FSVSPVISGL VFVLLFGAQG FVGPWLMAHD VRILFALPAI VLATTFVTFP 
FVARELIPLM QEQGQHEEEA AISLGASGWK TFWRVTLPNI KWGLLYGVLL CNARAMGEFG 
AVSVVSGHIR GETNTMPLLV EILYNEYQMV AAFAIASLLA LLALVTLIVK TILEGRIEEG 
LHTDDH