Gene Clim_2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2052
Symbol
ID	6355030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2261961
End bp	2263409
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	57%
IMG OID	642669648
Product	O-succinylbenzoate-CoA ligase
Protein accession	YP_001944060
Protein GI	189347531
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01923] O-succinylbenzoate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCTTG TAAACCGGGC ATCCCTGCTT TTCGACTCTT CACCCGCACT CATCTCCCCG 
GCAGCGACAC TCTCTTTCAG GCAGTGTGCC TCCATAACCT CCCGGATTGC CGGAAGGCTC 
TACGAAAAAG GACTCCGTTC AGGCGACGCT GTCGCCATAC TTTCACCGAA TAGTCCCGAA 
TCGGCACTGC TGATGATGTC GCTGCTGGGA AACGGCCTGA TCGCGGCTCC CCTGAACCAC 
CGCTTTCCTC CCGAACAGCT GCTGAAAACC CTGCAGGCTC TGCACCCAGA GATGGTGGTA 
ACGGCCGATC CTGAAATCAT AAAGCCGGGA GAAAGCCCGT TCAAGGCGGA AAATATGCAG 
GATATCGCGT TTGCAGCGTC GGAGCCTGAA AGCCCTGACA GGTCAGCTCC GAGGATGAAA 
ATGGAGCGCC CCGTCACCAT CATCCACACC TCGGCAAGTT CGGGATTGCC GAAAGCCGCC 
CAGCACAGCT TCGGCAACCA CTGGTACAGC GCACTCGGAG CGGCAAGGAA CATGCCGCTC 
GGAAACGGTG ACTGCTGGCT GCTTTCGCTT CCCTTCTTCC ACATCGGAGG CTATGCCGTG 
CTCTTCAGGG CTCTCGTATC CGGATCGGCC GTTGCTCTGC CGGACCCGCA TGATGCAATT 
GAACGGAGCC TTGAGCGCTT TCCTGCAACG CACCTTTCAC TGGTACCTAC GCAGCTCTAC 
CGGCTTCTCC GGAAACCGGA AACCCTGCCG ATCCTGAGAA AGCTCAAGGC CGTGCTGCTG 
GGAGGAAGCG CCGTTCCGGC TCCGCTGCTT GCAGAATGCA TCCGGGAAGG CATTCCCGTC 
TTTGTCAGTT ACGGCTCGAC GGAAATGAGC TCGCAGATTG CGACAACGCC AGCACCCGAC 
GGATCGTTTC GGAAAAACTG CGGCAAACCG CTCCCCTGGA GGGAACTCGC AATTGCAGGT 
GACGGAGAAA TTCTTGTCAG GGGCGCCTGC CTTTTTCAGG GATACCTCAA GAACAGCGCT 
TCAGGCCGTC AGCCGCATCC GGAGCTGGAC AGCGAAGGAT GGTTTCACAC CGGCGATACC 
GGAAGCCTCG ACGACAACGG CAATCTCTCG GTTTCCGGAC GCAAGGACAA CATGTTCATA 
TCGGGCGGTG AGAACCTCCA CTGCGAAGAG ATCGAAGAAG CATTAAGCAC CGTCGAGGGA 
ATCGAACAGG CTCTTGTGGT GCCGCTGGCA GACCGGGAAT ATGGCCAGAG AGCGGCAGCG 
TTCATAAAAA CCGCACAACC GGGCACTCCT ACCGACGACG CCATTACCGA AACCATGCTG 
AAAACCGCAG GAAGGCTGAA AACACCGGTA CTCTATATCA GAATTTGCCA ATGGGTAACG 
TTGCCGGGAT CGCAGAAAAT CGACAGGAAA TGGTACAACC GGCAGGTAAG GGAAGGAAAA 
ATCCATTAA

Protein sequence

MDLVNRASLL FDSSPALISP AATLSFRQCA SITSRIAGRL YEKGLRSGDA VAILSPNSPE 
SALLMMSLLG NGLIAAPLNH RFPPEQLLKT LQALHPEMVV TADPEIIKPG ESPFKAENMQ 
DIAFAASEPE SPDRSAPRMK MERPVTIIHT SASSGLPKAA QHSFGNHWYS ALGAARNMPL 
GNGDCWLLSL PFFHIGGYAV LFRALVSGSA VALPDPHDAI ERSLERFPAT HLSLVPTQLY 
RLLRKPETLP ILRKLKAVLL GGSAVPAPLL AECIREGIPV FVSYGSTEMS SQIATTPAPD 
GSFRKNCGKP LPWRELAIAG DGEILVRGAC LFQGYLKNSA SGRQPHPELD SEGWFHTGDT 
GSLDDNGNLS VSGRKDNMFI SGGENLHCEE IEEALSTVEG IEQALVVPLA DREYGQRAAA 
FIKTAQPGTP TDDAITETML KTAGRLKTPV LYIRICQWVT LPGSQKIDRK WYNRQVREGK 
IH