Gene Clim_1155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1155
Symbol
ID	6353671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1251631
End bp	1252761
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	52%
IMG OID	642668772
Product	bacteriochlorophyll/chlorophyll a synthase
Protein accession	YP_001943203
Protein GI	189346674
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0382] 4-hydroxybenzoate polyprenyltransferase and related prenyltransferases
TIGRFAM ID	[TIGR01476] bacteriochlorophyll/chlorophyll synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.142622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAA ACGCTGAGAG AAAAAGCCTC ACCGGGTCGG ATTTTTCCAT GCAAGGCGTG 
CTGTTCTTTC ATTTTATCGT GTTATTTTTG ATGCCGGCAG CAATTTTTCA CTTATTAATG 
ACAATGAGCG TGGCCAGAGG TGATTCAAAA CAGCGTACGG ACATATCGGA TAAAACAACA 
AACGGCATAC AGAAACCGCT CAATGTCCGC AAGTTCGTTG CGCCCCTGAA CCGCTCAACC 
GAAATCGGCT CAAGGCTTGC GCTCTTTATA CGCTTCCTCA AGCCGGTAAC CTGGATTCCG 
GTGATGTGGA GTTTTCTCTG CGGAGCCGTA GCAAGCGGAA AATTCGGATG GCACGACATC 
ATCGAAACGA AATTCATTCT TGCCATGCTG CTTACCGGAC CGCTGGCAAC GGGCACGTGC 
CAGATGCTGA ACGACTATTT CGACCGCGAC CTCGATGAAA TCAACGAACC TGACCGCCCT 
ATTCCCGGCG GAGCGATATC ATTGCAGAAT GCGACCATCC TGATTGCTGT CTGGTCGATA 
CTATCGGTTA TCGCCGGTTA TCTGATCAAT CCGCTGATCG GCTTTTATGT CGTCATCGGT 
ATCATCAATG CTCACCTCTA CAGCGCAAAC CCCATCAAAC TCAAGAAGCG CCTCTGGGCC 
GGCAATATCA TCGTCGCCGT ATCATACCTG ATCATTCCCT GGGTTGCCGG TGAAATCGCA 
TATAACCCTC AACTGAGCCT CGACTCGCTG CAGCCATCCC TGATCATCGC CTCCATGTAC 
ACCATTGCCA GCACCGGCAC GATGACGATC AACGACTTTA AATCCATTGA CGGTGACCGT 
CAGGCCGGCA TCCGAACCTT GCCTGCCGTA TTCGGCGAAA CCAACGCAGC TCTCATTGCC 
TCACTGCTGA TCAATCTTGG GCAGCTCCTT GCCACTGCCT GGCTTCTCCT TTCAGGAATG 
ATCTGGTTCG GATGGTTTAC CGCAGCTTTG ATCGTTCCGC AGTTTCTCCT GCAGTTCAGC 
CTTGTCCGAT CTCCCCGAAC CATGGATGTT CGCTACAACG CCATTGCCCA GAACTTCCTC 
GTGACAGGCA TGCTGGTCTG CGCCCTTGCC ATTAAAGCAT CCCGACCATG A

Protein sequence

MATNAERKSL TGSDFSMQGV LFFHFIVLFL MPAAIFHLLM TMSVARGDSK QRTDISDKTT 
NGIQKPLNVR KFVAPLNRST EIGSRLALFI RFLKPVTWIP VMWSFLCGAV ASGKFGWHDI 
IETKFILAML LTGPLATGTC QMLNDYFDRD LDEINEPDRP IPGGAISLQN ATILIAVWSI 
LSVIAGYLIN PLIGFYVVIG IINAHLYSAN PIKLKKRLWA GNIIVAVSYL IIPWVAGEIA 
YNPQLSLDSL QPSLIIASMY TIASTGTMTI NDFKSIDGDR QAGIRTLPAV FGETNAALIA 
SLLINLGQLL ATAWLLLSGM IWFGWFTAAL IVPQFLLQFS LVRSPRTMDV RYNAIAQNFL 
VTGMLVCALA IKASRP