Gene Clim_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2172
Symbol
ID	6355966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2409698
End bp	2410699
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	51%
IMG OID	642669763
Product	bacteriochlorophyll c synthase
Protein accession	YP_001944175
Protein GI	189347646
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0382] 4-hydroxybenzoate polyprenyltransferase and related prenyltransferases
TIGRFAM ID	[TIGR01476] bacteriochlorophyll/chlorophyll synthetase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGTTG CCGTACAACG ACCTGGATTT GTCGATAAAC TCAGGGCCCA TCTCGAACTG 
CTTGATCCGG TAACCTGGAT CAGCGTTTTT CCCTGTCTTG CCGGCGGTGT TATGGCATCG 
GGGGCCATGC AGCCAACCCT TCACGATTAC CTTCTGCTTG CATCGATCTT TCTGCTTTAC 
GGTCCGCTTG GAACCGGTTT CAGTCAATCT GTCAACGATT ATTTCGATCT CGAACTCGAC 
CGTGTCAACG AGCCTACGCG TCCTATTCCC TCGGGTCGCC TGAGCGTACA GGAAGCGCTC 
TGGAACAGTA TCGTCGTGCT GCTGCTTGCC ATCGGTCTGG GCGTCTTTCT CGGTCTGCAT 
ATCGGCGGCG TTCGGGGTAC GGTTATTATC GTTTCGATTC TGACTGCACT TGTTATTGCC 
TACATTTACT CCGCTCCTCC TCTCAAGCTC AAGAAAAATA TCGTTACCTC CGCTCCCGCG 
GTCGGGTTTT CGTACAGTTT CGTTACGTTT TTATCGGCCA ATGCCCTGTT CAGCGATATA 
CGTCCCGAAG TGATCTGGCT TGCAGGGCTT AATTTTTTCA TGGCCATAGC ACTCATCATC 
ATGAACGATT TCAAGTCTGT CGAGGGAGAC AAGGAGGGCG GGCTTAAATC TCTGGCGGTC 
ATGATCGGGT CCAGAAATAC GTTTCTGGTT TCGTTCATCA TCATTGATCT TGTGTTTGCT 
GTGCTTGCCT GGCTCGCCTG GAGCTGGGGG TTCACGGTGG CGATTGTGCT GGTGCTCATC 
GGTCTGGCGT TGAACATCGT CATTCAGATA CAATTGCTGC GCGATCCGAA AAGCAGCATA 
TCCTTTATGA AAGGCACCGT CGAGGACGGA TTCGGCAATG CGATAGGGAA AAGCGAAGTG 
CAGGAGCACA ATGCCTTTCT CCGATATCAG GTCGCCAACA ATATTCTCTT TCTTCTGAAT 
AACCTGATTG TGGCCGGTAT GATCGGCGCG AAATACATGT GA

Protein sequence

MSVAVQRPGF VDKLRAHLEL LDPVTWISVF PCLAGGVMAS GAMQPTLHDY LLLASIFLLY 
GPLGTGFSQS VNDYFDLELD RVNEPTRPIP SGRLSVQEAL WNSIVVLLLA IGLGVFLGLH 
IGGVRGTVII VSILTALVIA YIYSAPPLKL KKNIVTSAPA VGFSYSFVTF LSANALFSDI 
RPEVIWLAGL NFFMAIALII MNDFKSVEGD KEGGLKSLAV MIGSRNTFLV SFIIIDLVFA 
VLAWLAWSWG FTVAIVLVLI GLALNIVIQI QLLRDPKSSI SFMKGTVEDG FGNAIGKSEV 
QEHNAFLRYQ VANNILFLLN NLIVAGMIGA KYM