Gene Rpal_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1709
Symbol
ID	6409366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1832794
End bp	1833732
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	64%
IMG OID	642711597
Product	chlorophyll synthesis pathway, BchC
Protein accession	YP_001990712
Protein GI	192290107
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCA TCGCGGTCGT ACTCAAGCAG CCACAACAGG TCGAACTCAG TCGCTTGAGC 
CTTACGGCGC CGACTGACGA CGACATCGTT GTCGATGTGG CTTGGAGTGG CGTCAGCACC 
GGTACGGAGC GGCTGTTGTG GTCGGGCCGG ATGCCGCAAT TCCCCGGAAT GGGTTACCCG 
CTGGTCCCCG GCTATGAGTC GGTTGGCGAG GTCGTTGAGG CTGGATCGGC CACCGACCTG 
AAGCCGGGCC AGATGGTGTT CGTGCCCGGC GCGAAGTGCT TTGGCGAAGT GCGCGGCCTG 
TTCGGCGCCT CGGCGTCGCG GCTGGTGGTG CCCGCCAAGC GCGTGGTGCT GCTCGATTCG 
AAGCTCGGCG AGCGCGGCAT TCTGATCGCG CTGGCTGCGA CTGCTTATCA TGCGATCGCG 
GCGCGCGGCG CGACGCCACC CGACTGCATC GTCGGTCACG GCGTGCTCGG CCGTCTTCTG 
GCGCGGATTT CGATCGCGCT CGGCAATCCG CCGCCGGTGG TGTGGGAGAA GAATCCGATC 
CGCTCCGGCG GTGCCGAAGG TTATGCGGTG GTCGATCCCG CATCCGACGA ACGTCGCGAC 
TATCGCAGCA TCTACGACGT CAGCGGCGAT CCAAAATTAC TCGACACTTT GATCTCGCGC 
ATCGCGGCCA CCGGCGAGAT CGTGCTCGCT GGGTTTTACA GCGAGCCGCT GTCGTTCTCG 
TTCCCGCCCG CTTTCATGCG TGAAGCACGC ATTCGGGTTG CGGCGGAATG GCAGCCGCCG 
GACATCGGCG CCACCAAGGC GCTGATCGAA AGCGGCAAGC TCTCGCTCGA TGGACTGATC 
ACGCACCACC AGGAGGCGGC GTCGGCACCT GACGCCTATC GGATCGCTTT CGAAGACCCT 
GCCTGCCTCA AAATGGTTCT GAATTGGAGA CCGAGCTGA

Protein sequence

MDTIAVVLKQ PQQVELSRLS LTAPTDDDIV VDVAWSGVST GTERLLWSGR MPQFPGMGYP 
LVPGYESVGE VVEAGSATDL KPGQMVFVPG AKCFGEVRGL FGASASRLVV PAKRVVLLDS 
KLGERGILIA LAATAYHAIA ARGATPPDCI VGHGVLGRLL ARISIALGNP PPVVWEKNPI 
RSGGAEGYAV VDPASDERRD YRSIYDVSGD PKLLDTLISR IAATGEIVLA GFYSEPLSFS 
FPPAFMREAR IRVAAEWQPP DIGATKALIE SGKLSLDGLI THHQEAASAP DAYRIAFEDP 
ACLKMVLNWR PS