Gene Clim_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2042
Symbol
ID	6355546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2251422
End bp	2252765
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	51%
IMG OID	642669637
Product	citrate synthase I
Protein accession	YP_001944050
Protein GI	189347521
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTTA CAGAGACAGG AAATTCGCTG ACAATCGTTG ATAACCGGAC AGGAAAATCT 
TATGAGGTTC CGATCGAAAA CGGTTCCATC AACACGATGG AACTTCGTAA AATCAAGGTT 
TCCGAAGAGG ATTTCGGGTT GCTGGGATAC GATCCGGGGT ATCTGAATAC CGCATCCTGT 
AAAAGCAGAA TTACCTACAT TGACGGCGAC AAGGGGATTC TTCGCTATCG GGGATACCCG 
ATCGAGCAGC TTGCCGAAAA GAGCACGTTT CTTGAAACGG CATATCTGCT CATCAAGGGA 
GAACTGCCCG ACAAGGAGCG TCTGGCGGTA TGGACCTACA ACATCCGCCA CCATACCATG 
ACGCACAACA ATATCGTGAA ATTCATGGAC GGCTTCCGTT ACGACGCCCA TCCGATGGGA 
ATACTGGTTG GAACGGTAGG CGCGCTCTCG ACCTTCTACC GCGACGCGAA GGATATCCGG 
AACGAAGATT CCCGGAAACT GCAGGTTCGC AGGCTGATCG GCAAGATTCC GACGCTTGCT 
GCCATGAGTT TCAGGCACAG CATGGGATTT CCCTATGTAA TGCCGGATAA TGATCTCAGT 
TATGCGGGGA ACTTTCTTTC GATGATGTTC AAGATGACGG AGCTTCGATA CAAGCCGAAT 
CCGGTACTTG AACGGGCTCT CGATGTTCTG TTCATTCTGC ATGCCGACCA TGAACAGAAC 
TGTTCCACAA GCTCCCTGCG GGCTGTCGCA AGTTCAGGAG TCGATCCGTT TTCAGCTATT 
GCTGCCGGTT GTGCAGCGCT CTACGGTCCG TTGCACGGCG GAGCGAACGA AGCGGTTATC 
CGGATGCTTA TGAAGATCGG ATCGATCGAC AAAATACCGG AATTCATCCA ATCGGTAAAA 
GACGGGGATG GCCGTCTGAT GGGCTTTGGT CACAGGGTGT ACAAGAATTA CGATCCGAGA 
GCGAAGATTA TCAAGGATAT AGCATTCGAG GTGTTCGAGG AGACCGGCCG TAATCCGATG 
CTCGATATTG CGCTTGAACT TGAGAGAATC GCTCTTGAGG ACGACTACTT TGTCAGCAGG 
AAACTCTATC CGAATGTCGA TTTTTATTCC GGTCTTATTT ATCAGGCGAT GGGATTCCCC 
ATGGATATGT TCCCGGTGCT GTTCGCAATA GGAAGAATTC CCGGATGGCT TGCCCAGTGG 
ATCGAACATG TCAAGGACGA CGAGCAGAAA ATCGCCCGTC CCCGGCAGAT CTATCTTGGT 
GAAGATGAGC GACAGTTCAT CGCTATGGCA GATCGTCCGA AAACAAGGCT TGACGAGCAG 
ATGGCAGGGA TCTGCAGGCT TTAA

Protein sequence

MTVTETGNSL TIVDNRTGKS YEVPIENGSI NTMELRKIKV SEEDFGLLGY DPGYLNTASC 
KSRITYIDGD KGILRYRGYP IEQLAEKSTF LETAYLLIKG ELPDKERLAV WTYNIRHHTM 
THNNIVKFMD GFRYDAHPMG ILVGTVGALS TFYRDAKDIR NEDSRKLQVR RLIGKIPTLA 
AMSFRHSMGF PYVMPDNDLS YAGNFLSMMF KMTELRYKPN PVLERALDVL FILHADHEQN 
CSTSSLRAVA SSGVDPFSAI AAGCAALYGP LHGGANEAVI RMLMKIGSID KIPEFIQSVK 
DGDGRLMGFG HRVYKNYDPR AKIIKDIAFE VFEETGRNPM LDIALELERI ALEDDYFVSR 
KLYPNVDFYS GLIYQAMGFP MDMFPVLFAI GRIPGWLAQW IEHVKDDEQK IARPRQIYLG 
EDERQFIAMA DRPKTRLDEQ MAGICRL