Gene RPB_3964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3964
Symbol	rbcL
ID	3911771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4525057
End bp	4526514
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	64%
IMG OID	637885868
Product	ribulose bisophosphate carboxylase
Protein accession	YP_487568
Protein GI	86751072
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.909404
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.170199
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGT CAGTCACCGT CCGCGGCAAG GATCGCTACA AATCCGGCGT GATGGAATAC 
AAGAAGATGG GCTATTGGGA GCCCGACTAC GAGCCCAAAG ACACCGACGT CATCGCGCTG 
TTCCGTGTCA CGCCGCAGGA CGGCGTGGAT CCGATCGAGG CATCGGCAGC GGTGGCCGGC 
GAGTCTTCGA CCGCGACCTG GACCGTGGTG TGGACCGACC GTCTGACCGC GGCGGAGAAG 
TACCGCGCGA AGTGCTATCG CGTCGATCCG GTGCCGAATT CGCCCGGCCA GTATTTCGCT 
TACATCGCCT ACGATCTCGA CCTGTTCGAG AATGGCTCGA TCGCCAATCT GTCGGCGTCG 
ATCATCGGCA ACGTGTTCGG CTTCAAGCCA CTGAAAGCGC TGCGGCTCGA GGACATGCGG 
CTGCCGGTCG CCTATGTGAA GACGTTCCAG GGCCCCGCCA CCGGCATCGT GGTCGAGCGC 
GAGCGGATGG ACAAGTTCGG ACGTCCCTTG CTCGGCGCCA CCGTCAAGCC GAAGCTCGGC 
CTGTCGGGCC GCAACTACGG CCGCGTCGTC TACGAGGCGC TGAAGGGCGG GCTCGACTTC 
ACCAAGGACG ACGAGAACAT CAACTCGCAG CCGTTCATGC ATTGGCGCGA GCGCTTCCTG 
TATTGCATGG AGGCGGTGAA CAAGGCGCAG GCGGCGTCGG GCGAGATCAA GGGCACCTAT 
CTCAACGTCA CCGCCGGCAC CATGGAGGAG ATGTACGAGC GCGCCGAATT CGCCAAACAG 
CTCGGCTCGG TGATCATCAT GATCGACCTG GTGATCGGCT ACACCGCGAT CCAGTCGATG 
GCGAAATGGG CACGCAAGAA CGACATGATC TTGCATCTGC ATCGCGCCGG CCATTCGACC 
TACACCCGCC AGCGCAATCA CGGCGTGTCG TTCCGCGTCA TCGCCAAATG GATGCGGCTC 
GCCGGCGTCG ATCACATCCA TGCCGGCACC GTGGTCGGCA AGCTCGAAGG CGATCCGGCG 
ACCACCAAGG GCTACTACGA CATCTGCCGC GAGGACTACA ACCCGGCGAA TCTCGAGCAC 
GGCCTGTTCT TCGACCAGCA CTGGGCCAGC CTGAACAAGC TGATGCCGGT GGCCTCGGGC 
GGCATCCATG CCGGCCAGAT GCACCAGCTG CTCGACCTGC TCGGTGAGGA CGTCGTGCTG 
CAGTTCGGCG GCGGCACCAT CGGCCACCCG ATGGGCATCG CGGCCGGCGC CACCGCCAAT 
CGCGTCGCGC TGGAGGCGAT GATCCTCGCT CGCAACGAGG GCCGCGACTA CGTGCACGAA 
GGCCCGGAGA TTCTCGCCAA GGCGGCGCAG ACCTGCACGC CGCTGAAGGC TGCGCTCGAC 
ACCTGGAAGA ACGTGTCCTT CAATTACGAA TCCACCGACA CCCCCGACTA CGCGCCGACC 
CCCAGCGTCT CGGTCTAA

Protein sequence

MNESVTVRGK DRYKSGVMEY KKMGYWEPDY EPKDTDVIAL FRVTPQDGVD PIEASAAVAG 
ESSTATWTVV WTDRLTAAEK YRAKCYRVDP VPNSPGQYFA YIAYDLDLFE NGSIANLSAS 
IIGNVFGFKP LKALRLEDMR LPVAYVKTFQ GPATGIVVER ERMDKFGRPL LGATVKPKLG 
LSGRNYGRVV YEALKGGLDF TKDDENINSQ PFMHWRERFL YCMEAVNKAQ AASGEIKGTY 
LNVTAGTMEE MYERAEFAKQ LGSVIIMIDL VIGYTAIQSM AKWARKNDMI LHLHRAGHST 
YTRQRNHGVS FRVIAKWMRL AGVDHIHAGT VVGKLEGDPA TTKGYYDICR EDYNPANLEH 
GLFFDQHWAS LNKLMPVASG GIHAGQMHQL LDLLGEDVVL QFGGGTIGHP MGIAAGATAN 
RVALEAMILA RNEGRDYVHE GPEILAKAAQ TCTPLKAALD TWKNVSFNYE STDTPDYAPT 
PSVSV