Gene RPD_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1054
Symbol
ID	4021530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1208614
End bp	1209999
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	64%
IMG OID	637961246
Product	ribulose bisphosphate carboxylase
Protein accession	YP_568193
Protein GI	91975534
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.559684
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAAT CGAACCGCTA CGCCAACCTC AACCTCAAAG AAAGCGATCT GATCGCCGGC 
GGGCGGCATG TGCTGTGCGC CTACATCATG AAGCCGAAGG CCGGGTTCGG TAATTTCGTG 
GAAACGGCGG CGCATTTCGC CGCCGAGTCC TCCACCGGAA CCAATGTCGA AGTCTCGACC 
ACCGACGACT TCACCCGCGG CGTCGACGCG CTCGTCTACG AGGTCGACGA AGCCAAGGAA 
CTGATGAAGA TCGCCTATCC GATCGAGCTG TTCGACCGCA ACGTGATCGA CGGCCGCGCG 
ATGATCGCCT CGTTCCTGAC GCTGACGATC GGCAACAACC AGGGCATGGG CGACGTCGAA 
TACGCCAAGA TGCACGACTT CTACGTGCCG CCGGCCTATC TGCGGCTGTT CGACGGTCCG 
TCGACCACGA TCAAGGATCT GTGGCGCGTG CTCGGCCGGC CGGTGGTCGA TGGCGGCTTC 
ATCGTCGGCA CCATCATCAA GCCGAAGCTC GGCCTGCGGC CGCAGCCGTT CGCCGACGCC 
TGCTACGACT TCTGGCTCGG CGGCGACTTC ATCAAGAACG ACGAGCCGCA GGGCAATCAG 
GTGTTCGCGC CGTTCAAGGA CACCGTGCGC GCGGTCAACG ACGCGATGCG CCGCGCTCAG 
GATGCGACCG GTCAGCCCAA GCTGTTCTCG TTCAACATCA CCGCCGACGA TCACTACGAG 
ATGCTGGCGC GTGGCGAGTA CATCCTGGAG ACGTTCGGCG AGAACGCCGA TCACGTCGCC 
TTCCTGGTCG ACGGTTACGT CGCCGGTCCG GCCGCGGTGA CCACCGCGCG CCGTGCGTTC 
CCGAAGCAGT ATCTGCACTA TCATCGCGCC GGCCATGGCG CGGTGACCTC GCCGCAGAGC 
AAGCGCGGCT ACACCGCTTT CGTGCTGTCG AAGATGGCGC GACTGCAGGG CGCCTCCGGC 
ATCCACGTCG GCACCATGGG CTATGGCAAG ATGGAAGGCG AAGCTTCCGA TCGCGATTCC 
GCTTTCATGA TCACCCAGGA TTCAGCCGAG GGTCCGTACT TCAAGCAGGA GTGGCTCGGC 
ATGAACCCGA CCACGCCGAT CATCTCCGGC GGCATGAACG CGCTGCGGAT GCCCGGCTTC 
TTCGCCAATC TCGGCCACTC CAACCTGATC ATGACTGCAG GCGGCGGCGC CTTCGGTCAT 
ATCGATGGCG GCGCGGCCGG CGCCAGGTCG CTGCGGCAGG CCGAGCAGTG CTGGAAGCAG 
GGCGCCGATC CGGTCGCCTT CGCCAAGGAC CACCGCGAAT TCGCCCGCGC CTTCGAGAGC 
TTCCCTAACG ACGCCGACAA GCTGTATCCG AACTGGCGCA ACATGCTGAA GCTCGCTGCC 
GCGTGA

Protein sequence

MDQSNRYANL NLKESDLIAG GRHVLCAYIM KPKAGFGNFV ETAAHFAAES STGTNVEVST 
TDDFTRGVDA LVYEVDEAKE LMKIAYPIEL FDRNVIDGRA MIASFLTLTI GNNQGMGDVE 
YAKMHDFYVP PAYLRLFDGP STTIKDLWRV LGRPVVDGGF IVGTIIKPKL GLRPQPFADA 
CYDFWLGGDF IKNDEPQGNQ VFAPFKDTVR AVNDAMRRAQ DATGQPKLFS FNITADDHYE 
MLARGEYILE TFGENADHVA FLVDGYVAGP AAVTTARRAF PKQYLHYHRA GHGAVTSPQS 
KRGYTAFVLS KMARLQGASG IHVGTMGYGK MEGEASDRDS AFMITQDSAE GPYFKQEWLG 
MNPTTPIISG GMNALRMPGF FANLGHSNLI MTAGGGAFGH IDGGAAGARS LRQAEQCWKQ 
GADPVAFAKD HREFARAFES FPNDADKLYP NWRNMLKLAA A