Gene Cagg_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0040
Symbol
ID	7269037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	62561
End bp	63841
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	57%
IMG OID	643564913
Product	isocitrate lyase
Protein accession	YP_002461429
Protein GI	219846996
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACATGG ATCGTGCCGC ACAAATCAAA CAAATTGCAG ACAGTTGGAA CACACCTCGC 
TTTGCCGGTA TTGTGCGTCC GTACACTGCC GAAGATGTCT ATCGTTTGCG TGGTTCGGTA 
CAGATCGAAT ACACTCTGGC GCGGATGGGT GCCGAGCGCT TGTGGGATCT GCTGCACACC 
GAGCCGTATA TCAATGCCTT AGGCGCGCTG ACCGGTAATC AGGCGATGCA GCAGGTGAAG 
GCCGGATTGA AGGCGATCTA CTTGAGCGGA TGGCAGGTTG CGGCTGACGC TAACCTCGCC 
GGCCAAATGT ACCCTGACCA GAGCCTCTAT CCGGCAAATT CAGGCCCACA ATTGGTACGG 
GCTATCAACA ACGCGCTACG ACGCGCCGAT CAGATTTACC ACAGTGAAGG ACGCAACGAT 
ATTTACTGGT TTGCGCCGAT CGTTGCCGAT GCTGAGGCCG GGTTCGGTGG CCCGCTCAAT 
GTCTTCGAGA TTATGAAGGC GTACATCGAA GCCGGTGCGG CGGGCGTACA CTTTGAAGAT 
CAGCTTGCGT CCGAAAAGAA ATGTGGGCAT ATGGGTGGGA AAGTGTTGAT CCCAACCCAA 
GCTGCGATCC GCAATTTGGT GGCTGCCCGT TTGGCCGCCG ATGTGATGGG GGTGCCGACC 
CTTATTATCG CGCGTACCGA TGCTAATGCG GCAACCTTGC TGACGAGCGA TATTGATGAG 
CGCGACCGGC CCTTCTGCAC CGGTGAGCGA ACCAGCGAAG GCTTCTATCG AGTACGGGCC 
GGCCTTGATC AGGCAATTGC ACGCGGCTTA GCCTATGCAC CTTACGCCGA TATGATCTGG 
TGCGAGACGA GCGAGCCAAA CCTCGAAGAG GCACGACGCT TCGCCGAGGC AATTCATGCT 
CAATTCCCGG GCAAGCTGCT AGCGTACAAC TGCTCGCCTT CGTTCAACTG GAAGAAGAAG 
CTCGACGATG CAACGATTGC TGCATTCCAG CGTGAGCTGG GCGCAATGGG CTACAAGTTC 
CAGTTTGTGA CGCTGGCCGG CTTCCATACG CTTAACTATA GCATGTTTGA TTTGGCCCGG 
AAGTATCGTG ATCACGGTAT GGCGGCGTAC AGTGAGTTGC AGCAAGCGGA GTTTGCCGCT 
GAAGCGTTCG GCTACACAGC CACCCGCCAT CAGCGGGAGG TCGGTACCGG TTACTTCGAC 
GAGGTAGCGC AGGTGATCGC CGGTGGTGAG ATCAGTACCA CGGCACTGAC CGGAAGCACC 
GAGGAAGAGC AGTTCCATTA G

Protein sequence

MHMDRAAQIK QIADSWNTPR FAGIVRPYTA EDVYRLRGSV QIEYTLARMG AERLWDLLHT 
EPYINALGAL TGNQAMQQVK AGLKAIYLSG WQVAADANLA GQMYPDQSLY PANSGPQLVR 
AINNALRRAD QIYHSEGRND IYWFAPIVAD AEAGFGGPLN VFEIMKAYIE AGAAGVHFED 
QLASEKKCGH MGGKVLIPTQ AAIRNLVAAR LAADVMGVPT LIIARTDANA ATLLTSDIDE 
RDRPFCTGER TSEGFYRVRA GLDQAIARGL AYAPYADMIW CETSEPNLEE ARRFAEAIHA 
QFPGKLLAYN CSPSFNWKKK LDDATIAAFQ RELGAMGYKF QFVTLAGFHT LNYSMFDLAR 
KYRDHGMAAY SELQQAEFAA EAFGYTATRH QREVGTGYFD EVAQVIAGGE ISTTALTGST 
EEEQFH