Gene RPB_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1043
Symbol
ID	3908895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1199864
End bp	1200739
Gene Length	876 bp
Protein Length	291 aa
Translation table	11
GC content	66%
IMG OID	637882936
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_484664
Protein GI	86748168
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.582671
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCG CCGCCCGCGA CCCCCTCGCC GCCAAGCCGG TGTCGTTCGC CGATCTCGAC 
CCGCGCGAAC AGCTCCGCCC GATGGATCAT CTCGACGCGC TGGAAGCGCA GAGCATCTAC 
ATATTCCGTG AAGGTTTTGC GCGGCTGAAG AAGCTGGCAC TGCTGTGGTC GCTCGGCAAA 
GATTCCAACG TGATGATCTG GCTGGCGCGC AAGGCGTTCT TCGGCAAGGT GCCGTTCCCG 
GCGCTGCACG TCGACACCGG CAAGAAGTTT CCTGAGATGT ACGCCTTCCG CGAACACTAC 
GCGAAGGAGT GGGATCTCGA TTTGCGCGTC GATCCCTGCC CGCCGATCGA CAGCGTCGAT 
CCGACCCTGC CGCCGGCGGC GCGCTCGGCG GCGCGCAAGA CCGAAGGCTT GAAGCTGGCG 
CTGGCCAAAT ACGGCTTCGA CGGACTGATC GCCGGCATCC GCCGCGACGA GGAGGCGACC 
CGCGCCAAAG AACGCGTGTT CTCGCCGCGC GGCACCGAGG GCGGCTGGGA CGTGCGCGAT 
CAGCCGCCGG AATTCTGGGA CCAGTTCAAC GCCTCGCCGC CGCCCGGCGC TCACTTGCGT 
ATTCACCCCA TCCTGCATTG GACCGAGGCC GACATCTGGG CCTACACCAA GCGCGAGAAC 
ATCCCGATCA TCCCGCTGTA TCTGGCCAAG GACGGCAAGC GCTATCGCTC GCTCGGCGAC 
CAGGACATCA CCTTCCCGGT GGCGTCGCAC GCCTCGTCGA TCGACGAGAT CCTGCACGAA 
TTGCAGACCA CCAAGGTGCC GGAGCGCGCC GGCCGCGCGC TCGACCACGA GACCGAGGAC 
GCGTTCGAGC GGCTTCGCGT CGCCGGTTAT CTGTGA

Protein sequence

MTLAARDPLA AKPVSFADLD PREQLRPMDH LDALEAQSIY IFREGFARLK KLALLWSLGK 
DSNVMIWLAR KAFFGKVPFP ALHVDTGKKF PEMYAFREHY AKEWDLDLRV DPCPPIDSVD 
PTLPPAARSA ARKTEGLKLA LAKYGFDGLI AGIRRDEEAT RAKERVFSPR GTEGGWDVRD 
QPPEFWDQFN ASPPPGAHLR IHPILHWTEA DIWAYTKREN IPIIPLYLAK DGKRYRSLGD 
QDITFPVASH ASSIDEILHE LQTTKVPERA GRALDHETED AFERLRVAGY L