Gene Rsph17025_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2037
Symbol
ID	5082651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2079841
End bp	2080797
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	68%
IMG OID	640483599
Product	chlorophyll synthesis pathway, BchC
Protein accession	YP_001168233
Protein GI	146278074
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.228307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0545701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAACGA CCGCCGTCAT CCTGTCGGGT CCCCGGGACC TGGGTCTTCA ATCCATCCAG 
TTGAACATGC CCGCGCCCGG CGACATCGTG GTTGAAATTA CCCATTCGGG AATTTCGACC 
GGCACCGAGA AGCTGTTCTA CACCGGGCAG ATGCCGCCTT TCCCGGGCAT GGGCTATCCG 
CTGGTTCCCG GCTACGAGGC CGCGGGCGAG GTGGTCGAGG CCGCCCCCGA CACCGGCTTC 
AAGCCGGGCG ACCGGGTGTT CGTGCCGGGT TCGAACTGCT TTGCCCCGAC CGAGGCCGGC 
CCGATCCGCG GCCTCTTCGG TGCTGCGACC AAGCGGCTGA TCACGCCCGC CCATCGCGCG 
GTCCGCATCG ACCCGGCGCT CGAGGCCGAG GGCGCGCTCC TGGCGCTGGC CGCTACCGCC 
CGCCACGCGC TCGCCGGGCT GAACAACGTG CTGCCGGACC TGATCGTAGG CCACGGCACG 
CTGGGGCGGC TGCTTGCGCG GCTGACCATC GCCGCGGGCG GCGAGCCTCC GGTGGTCTGG 
GAGACCAAGC CCGAGCGCAG GAAGCACGCG CAGGGCTATG AGGTCATCGA CCCGGCCACC 
GATCCCCGAC GCGACTACCA GTCGATCTAT GACGCCTCGG GCGATCCGAA GCTCATCGAC 
ACGCTGGTGA TGCGGCTCGC CAAGTGTGGC GAGATCGTCC TCGCCGGCTT CTACACCGAA 
CCCGTCGCCT TCACCTTCGT GCCCGCCTTC ATGAAGGAAG CCCGAATCCG CATCGCTGCC 
GAGTGGCAGC CCGAGGACAT GGTGGCCACC CGCGCGCTGA TCGAGAGCGG GGCGCTTTCG 
CTTGCCAACC TGATCACCCA CACCCGCCCC GCGTCGGAGG CGCCCGAGGC CTATGCAACG 
GCCTTCAACG ACCCCGACTG CCTGAAGATG ATCCTGGATT GGAGAGCCAC CGCATGA

Protein sequence

MRTTAVILSG PRDLGLQSIQ LNMPAPGDIV VEITHSGIST GTEKLFYTGQ MPPFPGMGYP 
LVPGYEAAGE VVEAAPDTGF KPGDRVFVPG SNCFAPTEAG PIRGLFGAAT KRLITPAHRA 
VRIDPALEAE GALLALAATA RHALAGLNNV LPDLIVGHGT LGRLLARLTI AAGGEPPVVW 
ETKPERRKHA QGYEVIDPAT DPRRDYQSIY DASGDPKLID TLVMRLAKCG EIVLAGFYTE 
PVAFTFVPAF MKEARIRIAA EWQPEDMVAT RALIESGALS LANLITHTRP ASEAPEAYAT 
AFNDPDCLKM ILDWRATA