Gene Cphamn1_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_2007
Symbol
ID	6375700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2158973
End bp	2160259
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	51%
IMG OID	642684498
Product	Ribulose-bisphosphate carboxylase
Protein accession	YP_001960398
Protein GI	189500928
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.167441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCGG AAGAGAGAAA AGGATTTTTT GCAGACAGGG ATCAGCTGAA TATGGCTGAC 
TATCTGGAAC TTGAGTATTA CCTTGAGTGT GTAGGTGATA TCAGGACAGC GTTAGCTCAT 
TTTTGCAGTG AGCAGTCAAC AGCCCAGTGG AACAGGGTAG GTGTTGACGA AGACTTCAGG 
ACGCTCTACG CGGCCAAGGT TCTTGGATGG CAGGTTCTCG AGGAACTCAA AGAGCTCAGC 
TATCCGGTTG AGCATGACGC TGTTGGTAAA ATTCATGCCT GTCGGGTCAC GATTGCCCAT 
CCTCACAGGA ATTTTGGGGC CAAACTGCCC AACCTCCTCA CAGCGGTGTG CGGTGAAGGG 
ACGTACTTCA CTCCCGGGAT TCCTCTTGTC AAGTTGCTGG ATATCTCTTT TCCGGACTCC 
TACCTTGCGG AATTCGAAGG CCCGAAATTC GGCATCGAAG GCATTCGAGA GATGCTCGGA 
GCCTACAATC GACCGATTTT TTTCGGAGTG GTCAAGCCCA ACATCGGGCT TTCTCCTGAA 
TACTTTTCAG ACCTAGCCTT TCAGAGCTGG CTGGGAGGGC TCGATATAGC AAAAGACGAT 
GAGATGCTTG CCGATGTCGC ATGGTCAACC ACAAGTCGTC GTACAGAACT TCTGGGCAAA 
GCTCGGGTTC TTGCTGAAAA AGAGACAGGT GATAAAAAAA TCTATCTGGC CAACATAACC 
GATGAGGTTG ACAAAATGAT CGAGCAGCAT GATGTTACCG TGGCAAACGG AGCAAACGCG 
TTGCTGGTGA ACGCGTTTCC TGTTGGGCTG AGTGCGGTGA GAATGCTTCG CAAACATACA 
AAAGTACCGC TGATAGGGCA TTTTCCCTTT ATAGCCGCGT TTTCCCGCCT TGAAAAGTAC 
GGTATTCACT CAAAAGTTAT CACAAAACTG CAGCGCCTTG CGGGTCTTGA TGCAATTATC 
ATGCCCGGTT TCGGGAGTCG CATGATGACT CCTGAGCAGG AAGTTCGTGA AAATATCGAG 
GAGTGCCTGA ATGAGATGGG TTCACTCAAG CGTTCACTGC CTGTTCCAGG CGGCAGCGAT 
TCGGCGCTGA CACTGGAGAA CGTCTACCGT AAGGTCGGCA GCGTAGATTT CGGATTTGTT 
CCCGGAAGAG GGATTTTCGG CCACCCGATG GGTCCGAAAG CGGGCGCGTC AAGCATACGC 
CAGGCATGGG AGGCCATAGA ACAGGGTGTC GAACTTGAAG CGTATGCAGA AACACGCCCT 
GAGCTCAAGG CAATGCTGGG TAAGTAG

Protein sequence

MNAEERKGFF ADRDQLNMAD YLELEYYLEC VGDIRTALAH FCSEQSTAQW NRVGVDEDFR 
TLYAAKVLGW QVLEELKELS YPVEHDAVGK IHACRVTIAH PHRNFGAKLP NLLTAVCGEG 
TYFTPGIPLV KLLDISFPDS YLAEFEGPKF GIEGIREMLG AYNRPIFFGV VKPNIGLSPE 
YFSDLAFQSW LGGLDIAKDD EMLADVAWST TSRRTELLGK ARVLAEKETG DKKIYLANIT 
DEVDKMIEQH DVTVANGANA LLVNAFPVGL SAVRMLRKHT KVPLIGHFPF IAAFSRLEKY 
GIHSKVITKL QRLAGLDAII MPGFGSRMMT PEQEVRENIE ECLNEMGSLK RSLPVPGGSD 
SALTLENVYR KVGSVDFGFV PGRGIFGHPM GPKAGASSIR QAWEAIEQGV ELEAYAETRP 
ELKAMLGK