Gene Rsph17029_1907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1907
Symbol
ID	4895137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2019670
End bp	2020626
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	69%
IMG OID	640112501
Product	chlorophyll synthesis pathway, BchC
Protein accession	YP_001043783
Protein GI	126462669
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.274753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.343747
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAACGA CCGCCGTCAT CCTGTCGGGT CCGCGGGACC TTGGCCTTCA GACCATCCAG 
CTGAACGAGC CCGCGCCCGG CGATATCGTC GTCGAGATCA CCCATTCGGG CATTTCGACG 
GGCACCGAAA AACTGTTCTA CACCGGCCAG ATGCCGCCCT TTCCGGGCAT GGGCTACCCG 
CTGGTGCCGG GCTACGAGGC CGCCGGCGAA GTGGTCGAGG CCGCGCCCGA TACGGGCTTC 
CGGCCGGGCG ACCGGGTCTT CGTGCCGGGC TCCAACTGTT TTGCGCCGAC CGATGCGGGG 
CCGATCCGCG GCCTGTTCGG AGCGGCGACG AAGCGGCTCG TGACGCCCGC CCATCGCGCC 
GTGCGCATCG ATCCTGCGCT CGAGGCCGAG GGGGCGCTTC TGGCGCTTGC CGCGACCGCG 
CGCCATGCGC TGGCCGGGCT GAACCATGTG CTGCCGGACC TGATCGTGGG TCACGGCACG 
CTGGGCCGGC TGCTCGCGCG TCTGACCATT GCCGCGGGCG GCGAGCCGCC GGTGGTCTGG 
GAGACCAAGG CGGAACGGCG CCGCCATGCC GAGGGCTACG AGGTCATCGA CCCCGCGACC 
GACCAGCGCC GCGACTACCG CTCGATCTAC GATGCGTCGG GCGATCCGAA ATTGATCGAC 
AGTCTGGTGA TGCGGCTTGC CAAGGGCGGC GAGATCGTGC TGGCGGGCTT CTATACCGAA 
CCCGTTGCCT TCACCTTCGT GCCCGCCTTC ATGAAGGAGG CGCGCCTGCG CATCGCTGCC 
GAGTGGCAGC CCGAGGACAT GGTGGCCACC CGCGCGCTGA TCGAGAGCGG GGCGCTTTCG 
CTTGCCAATC TGATCACCCA CACCCGACCG GCGTCGGAGG CGGCCGAGGC CTACGCCACG 
GCCTTCAGCG ACCCCGACTG TCTCAAGATG ATCCTGGATT GGAGGGCCAC CGCATGA

Protein sequence

MRTTAVILSG PRDLGLQTIQ LNEPAPGDIV VEITHSGIST GTEKLFYTGQ MPPFPGMGYP 
LVPGYEAAGE VVEAAPDTGF RPGDRVFVPG SNCFAPTDAG PIRGLFGAAT KRLVTPAHRA 
VRIDPALEAE GALLALAATA RHALAGLNHV LPDLIVGHGT LGRLLARLTI AAGGEPPVVW 
ETKAERRRHA EGYEVIDPAT DQRRDYRSIY DASGDPKLID SLVMRLAKGG EIVLAGFYTE 
PVAFTFVPAF MKEARLRIAA EWQPEDMVAT RALIESGALS LANLITHTRP ASEAAEAYAT 
AFSDPDCLKM ILDWRATA