Gene RPB_0951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0951
Symbol
ID	3909306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1100131
End bp	1101516
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	64%
IMG OID	637882844
Product	ribulose bisphosphate carboxylase
Protein accession	YP_484572
Protein GI	86748076
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGT CGAGCCGCTA CGCCAACCTC AACCTCAAAG AAAGCGATCT GATCGCGGGC 
GGGCGGCATG TGCTGTGCGC CTACATCATG AAGCCGAAGG ACGGCTTCGG CAATTTCCTG 
CAGACCGCCG CACATTTTTC GGCCGAATCC TCGACTGGTA CCAATGTCGA AGTCTCCACC 
ACCGACGACT TCACCCGCGG CGTCGATGCG CTGGTCTACG AGATCGACGA AGCCAACAAC 
GTGATGAAGA TCGCCTACCC GATCGAACTG TTCGATCGCA ACGTGATCGA TGGCCGCGCG 
ATGATCGCCT CGTTCCTGAC GCTGACGATC GGCAACAACC AGGGCATGGG CGACGTCGAA 
TACGCCAAGA TGCACGATTT CTACGTGCCG CCCGCGTATC TGCGGCTGTT CGACGGCCCC 
TCGACCACGA TCCGGGATCT GTGGCGCGTG CTCGGCCGGC CGGTGGTCGA CGGCGGCTTC 
ATCGTCGGCA CCATCATCAA GCCCAAGCTC GGCCTGCGGC CGCAGCCTTT CGCCGATGCC 
TGCTACGATT TCTGGCTCGG CGGCGATTTC ATCAAGAACG ACGAACCGCA GGGCAATCAG 
GTGTTTGCGC CGTTCAAGGA GACGGTGCGG GCGGTCAACG AGGCGATGCG CCGCGCCCAG 
GACAAGACCG GCGAGCCGAA GCTGTTCTCG TTCAACATCA CCGCCGACGA TCACTACGAG 
ATGGTGGCGC GCGGCGAATA CATCCTCGAG ACCTTCGCCG ACAACGCCGA CCACGTCGCC 
TTCCTGGTCG ACGGCTATGT CGCCGGCCCC GCCGCGGTGA CCACGGCGCG CCGCGCGTTC 
CCGAAGCAGT ATCTGCACTA TCATCGCGCC GGCCACGGCG CGGTGACCTC GCCGCAGTCA 
AAGCGCGGCT ACACCGCATT CGTGCTGTCG AAGATGGCCC GGCTGCAGGG AGCCTCCGGC 
ATCCACACCG GCACCATGGG CTTCGGCAAG ATGGAAGGCG AAGCCGCCGA TCGCGCCATG 
GCCTACATGA TCACCGAAGA CTCGGCGGAC GGACCGTTCT TCCACCAGGA ATGGCTCGGC 
ATGAATCCGA CCACGCCGAT CATCTCCGGC GGCATGAACG CGCTGCGGAT GCCCGGCTTC 
TTCGACAATC TCGGCCACTC CAACCTGATC ATGACCGCGG GCGGCGGCGC CTTCGGCCAT 
ATCGACGGCG GCGCGGCGGG CGCCAAGTCG CTGCGGCAGG CTGAGCAGTG CTGGAAGGCT 
GGCGCCGATC CGGTCGAATT CGCCAAGGAT CATCGCGAAT TCGCCCGCGC CTTCGAGAGC 
TTCCCGCACG ATGCCGATGC GCTGTACCCG AACTGGCGCA ATTCGCTCAA GCTCGCAGCC 
GCGTAA

Protein sequence

MDQSSRYANL NLKESDLIAG GRHVLCAYIM KPKDGFGNFL QTAAHFSAES STGTNVEVST 
TDDFTRGVDA LVYEIDEANN VMKIAYPIEL FDRNVIDGRA MIASFLTLTI GNNQGMGDVE 
YAKMHDFYVP PAYLRLFDGP STTIRDLWRV LGRPVVDGGF IVGTIIKPKL GLRPQPFADA 
CYDFWLGGDF IKNDEPQGNQ VFAPFKETVR AVNEAMRRAQ DKTGEPKLFS FNITADDHYE 
MVARGEYILE TFADNADHVA FLVDGYVAGP AAVTTARRAF PKQYLHYHRA GHGAVTSPQS 
KRGYTAFVLS KMARLQGASG IHTGTMGFGK MEGEAADRAM AYMITEDSAD GPFFHQEWLG 
MNPTTPIISG GMNALRMPGF FDNLGHSNLI MTAGGGAFGH IDGGAAGAKS LRQAEQCWKA 
GADPVEFAKD HREFARAFES FPHDADALYP NWRNSLKLAA A