Gene RPD_3722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3722
Symbol	rbcL
ID	4024238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4156303
End bp	4157760
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	63%
IMG OID	637963926
Product	ribulose bisophosphate carboxylase
Protein accession	YP_570844
Protein GI	91978185
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0880816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00193394
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGACT CAATCACGGT CCGCGGCAAG GATCGCTACA AATCCGGCGT GATGGAATAC 
AAGAAGATGG GCTATTGGGA GCCTGACTAC GTGCCCAAGG ACACCGACGT CATCGCTCTG 
TTCCGCGTCA CCCCGCAGGA CGGCGTCGAT CCGATCGAAG CTTCCGCTGC CGTCGCGGGC 
GAATCCTCGA CCGCCACCTG GACCGTGGTG TGGACCGATC GCTTGACCGC GGCCGAGAAG 
TATCGTGCGA AGTGCTATCG CGTCGATCCC GTGCCGAATT CGCCCGGCCA GTATTTTGCT 
TACATCGCCT ACGATCTCGA CCTGTTCGAG AACGGCTCGA TCGCCAATCT GTCGGCGTCG 
ATCATCGGCA ACGTGTTCGG ATTCAAGCCG CTGAAGGCGT TGCGGCTCGA GGACATGCGG 
CTGCCGATCG CTTACGTCAA GACGTTCCAG GGGCCGGCCA CCGGCATCGT GGTCGAGCGT 
GAGCGCATGG ACAAGTTTGG CCGGCCGCTG CTCGGCGCCA CCGTCAAACC GAAGCTCGGC 
CTCTCCGGTC GCAACTACGG CCGCGTGGTC TATGAAGCGC TGAAGGGCGG CCTCGACTTC 
ACCAAGGACG ACGAGAACAT CAACTCGCAG CCGTTCATGC ATTGGCGCGA GCGCTTCCTG 
TACTGCATGG AGGCGGTCAA CAAGGCGCAG GCAGCGTCGG GCGAGATCAA GGGCACCTAT 
CTCAACGTCA CCGCCGGCAC CATGGAGGAG ATGTACGAGC GCGCTGAATT CGCCAAGCAG 
CTCGGCTCGG TCATCATCAT GATCGATCTG GTGATCGGCT ACACCGCGAT CCAGTCGATG 
GCGAAGTGGG CCCGCAGGAA CGACATGATC CTGCATCTGC ACCGCGCCGG TCATTCCACC 
TACACCCGCC AGCGCAATCA TGGCGTGTCG TTCCGCGTTA TCGCCAAGTG GATGCGGCTC 
GCCGGTGTCG ATCACATCCA TGCCGGCACC GTGGTCGGCA AGCTGGAGGG CGATCCGTCG 
ACCACCAAGG GCTACTACGA CATCTGCCGC GAAGACTACA ACCCGGCCAA TCTCGAGCAC 
GGCCTGTTCT TCGACCAGCC CTGGGCGAGC CTGAACAAGC TGATGCCGGT CGCTTCCGGC 
GGCATCCATG CCGGCCAGAT GCACCAGTTG CTCGATCTGC TCGGCGAGGA CGTCGTGCTG 
CAGTTCGGCG GCGGCACGAT CGGCCATCCG ATGGGCATCG CAGCGGGCGC AACCGCCAAC 
CGCGTCGCGC TCGAAGCCAT GATCCTCGCT CGCAACGAGG GCCGCGACTA TGTGCACGAA 
GGCCCGGAAA TTCTCGCCAA GGCGGCGCAG ACCTGCACGC CGTTGAAGGC GGCGCTCGAC 
ACCTGGAAGA ACGTCTCCTT CAACTACGAA TCCACCGATA CCCCCGACTA TGCGCCGACA 
CCCAGCGTCT CGATGTAA

Protein sequence

MNDSITVRGK DRYKSGVMEY KKMGYWEPDY VPKDTDVIAL FRVTPQDGVD PIEASAAVAG 
ESSTATWTVV WTDRLTAAEK YRAKCYRVDP VPNSPGQYFA YIAYDLDLFE NGSIANLSAS 
IIGNVFGFKP LKALRLEDMR LPIAYVKTFQ GPATGIVVER ERMDKFGRPL LGATVKPKLG 
LSGRNYGRVV YEALKGGLDF TKDDENINSQ PFMHWRERFL YCMEAVNKAQ AASGEIKGTY 
LNVTAGTMEE MYERAEFAKQ LGSVIIMIDL VIGYTAIQSM AKWARRNDMI LHLHRAGHST 
YTRQRNHGVS FRVIAKWMRL AGVDHIHAGT VVGKLEGDPS TTKGYYDICR EDYNPANLEH 
GLFFDQPWAS LNKLMPVASG GIHAGQMHQL LDLLGEDVVL QFGGGTIGHP MGIAAGATAN 
RVALEAMILA RNEGRDYVHE GPEILAKAAQ TCTPLKAALD TWKNVSFNYE STDTPDYAPT 
PSVSM