Gene Clim_1067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1067
Symbol
ID	6354717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1170346
End bp	1171425
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	57%
IMG OID	642668684
Product	L-threonine-O-3-phosphate decarboxylase
Protein accession	YP_001943115
Protein GI	189346586
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01140] L-threonine-O-3-phosphate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.748471
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGTC TTTATTATCA TGAACACGGC GGAGAAACTG AACGTCGTTT CGGTGCTAAA 
CCCGCCGGTT TGCTCGATTT CAGCGTCAAC ATCAGCCCGC TTTTTCCGCT TCAGGAGCCT 
TTGGCGATCG ACAGTACCGA TCTGCAGACT TACCCTTCAA TAGACGGAAA GGGAGTGTGC 
GGATTCTACG CCAGAAAGTT CGGGCTGGAT GCAGCGTCTG TGATCGCCCT TAACGGGGCT 
GTAGAGGGAA TCTACCTCCT GCCGAGGGCG TTGGGCATAC GCCGGATGCT GCTGCTTGCG 
CCATCGTTTT ACGAATACGA ACGGGCCGCC CGTATTGCCG GCGCCGAAAT CGGATTTGTC 
GAACTTGTCG CCGGGGACGG GTTCGCTCTC CCTGCAATCG GCGAACTGGC GGCCAGACTG 
CAGCACTACG ATGCGTTTTT TGTCGCGAAT CCCAACAACC CGACCGGTAC TCTGTTTCCT 
CCCGAAGTGA CCATGGCGCT TGCAAGCCGG TTTCCCGACA AGTGGTTTTT CGTTGACGAA 
GCCTTTATAC AGTTTCAGCC GGATTTTCCG GAAGTGTCGC TGATGCGCCG TATTCCGGCT 
TTCCGCAATA TCGTTGTCGT GCATTCGCTG ACGAAATTCT ATGCGCTTCC GGGACTGCGA 
CTCGGTGCGC TCATAGCTCA TCCGGATACG ACCAGAAGAC TCTACGATTT CAAGGAGCCC 
TGGACGGTCA ATGCCGTTGC CGAAAGGGTT GCGGGCGAAC TGGCCGGGTG CTTCGCTTAT 
GAAGCGGCTC TCCGTTCGAT GATCGATTGC GAAAGAGGAC GGCTCGCTGA GGCTCTGACG 
GAAATCGAAG GGGTGCGCAT TGCCGGGGGA GCGGCGAACT TTTTTCTCGC CCAATGGCGC 
CGTTCGAGTT CGCTGGATGA ATTGATTGCA CATTTTCTGT CGCAGGGCAT AAAGGTGCGG 
GACTGCAGGA ATTTCAGGGG TCTCGAGGCC GACTATTTCC GTTTTGCCGT CCGCACGCCG 
CAGGAGAACG ACCGTTTTCT CGAAGCGCTT CGTGCCGTTC CGGCGCTGCA ATGGGCGTGA

Protein sequence

MNSLYYHEHG GETERRFGAK PAGLLDFSVN ISPLFPLQEP LAIDSTDLQT YPSIDGKGVC 
GFYARKFGLD AASVIALNGA VEGIYLLPRA LGIRRMLLLA PSFYEYERAA RIAGAEIGFV 
ELVAGDGFAL PAIGELAARL QHYDAFFVAN PNNPTGTLFP PEVTMALASR FPDKWFFVDE 
AFIQFQPDFP EVSLMRRIPA FRNIVVVHSL TKFYALPGLR LGALIAHPDT TRRLYDFKEP 
WTVNAVAERV AGELAGCFAY EAALRSMIDC ERGRLAEALT EIEGVRIAGG AANFFLAQWR 
RSSSLDELIA HFLSQGIKVR DCRNFRGLEA DYFRFAVRTP QENDRFLEAL RAVPALQWA