Gene Cphamn1_2226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_2226
Symbol
ID	6375920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2411348
End bp	2412358
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	45%
IMG OID	642684713
Product	bacteriochlorophyll c synthase
Protein accession	YP_001960612
Protein GI	189501142
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0382] 4-hydroxybenzoate polyprenyltransferase and related prenyltransferases
TIGRFAM ID	[TIGR01476] bacteriochlorophyll/chlorophyll synthetase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTTA GTGTCAACCG CAGTATGAGT TTTACCGACA AGGTCAGAGC CCACCTTGAA 
ATTCTTGATC CGGTTACCTG GATCAGTGTT TTCCCTTGCC TTGCCGGTGG TGTCATGGCT 
TCGGGCGCCA TGCAGCCCAC GCTTCATGAT TATTTTCTCC TTCTGGCGAT TTTTTTAATG 
TTCGGTCCTC TGGGCACCGG ATTCAGCCAG TCAATAAACG ATTATTATGA TCTTGAACTG 
GACAAGGTCA ACGAGCCGAC ACGGCCTATT CCCTCAGGGC GAATGACTGA GAAAGAAGCT 
GTCTGGAACA GCGTCGTGGT TTGTCTGCTG GCTCTTTGTC TTGGTGTTTT TCTCGGCTTT 
TACATTGGCG GCGAAAGAGG ACTGATTATC ACGTCCTCGA TAGTCGCTGG TCTGATCGTT 
GCCTACATCT ATTCTGCGCC ACCGCTGAAG CTCAAGAAAA ACATACTGAC TTCTGCACCG 
GCCGTAGGTT TTTCATACAG TCTGGTAACC TGGTTTTCGG CAAATGCCCT GTTCAGTGAA 
ATTCGGCCGG AAGTATACTG GCTGGCGGGA CTTAACTTTT TTATGGCAAT GGCGCTTATC 
ATCATGAATG ATTTCAAATC CGCAAAGGGA GACAAAGAAG GGGGGATGAA GTCGCTTACA 
GTTATGATAG GTATGAAAAA TACTTTTCTG GTTTCATTTA TTATGATCGA TCTGGTGTTT 
CTTGTTTTTG CCTGGCTTGA ATATCAATGG GGCTTTTATT ATCTGGTTGT TTTAATGCTT 
GGCGGATTGA TCCTTAACAT ATACATGCAG GTAAAACTGT ATGCCGATCC GAAAGGCGGC 
GTGGCATTTA TGGGAAGTGC TGTAGATGAT GTTTTTGGTA ACACTATTGG ACAGAGTGAA 
GTCGAAGAAC ATAAGGCCTA TCTCCGGTTT CAGATCGCAA ACAATGTTCT GTTTCTTTCC 
AACAATCTGT TCGCTGCAGG CGCGATTGGT ATGAAGTATA TGCAAGGATA G

Protein sequence

MSVSVNRSMS FTDKVRAHLE ILDPVTWISV FPCLAGGVMA SGAMQPTLHD YFLLLAIFLM 
FGPLGTGFSQ SINDYYDLEL DKVNEPTRPI PSGRMTEKEA VWNSVVVCLL ALCLGVFLGF 
YIGGERGLII TSSIVAGLIV AYIYSAPPLK LKKNILTSAP AVGFSYSLVT WFSANALFSE 
IRPEVYWLAG LNFFMAMALI IMNDFKSAKG DKEGGMKSLT VMIGMKNTFL VSFIMIDLVF 
LVFAWLEYQW GFYYLVVLML GGLILNIYMQ VKLYADPKGG VAFMGSAVDD VFGNTIGQSE 
VEEHKAYLRF QIANNVLFLS NNLFAAGAIG MKYMQG