Gene Cagg_3782 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3782
Symbol
ID	7267856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4615108
End bp	4616706
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	56%
IMG OID	643568590
Product	malate synthase
Protein accession	YP_002465054
Protein GI	219850621
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.153357
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0512216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC CCCACTTTCC GGCCGGTGTG ACCATCACAG CGCCCATCAC TCCCGAGTAC 
GCCGAGATCC TCACCCCTGA AGCTTTAGAG TTCCTCGCTA CCCTACATCG TCGCTTTAAT 
GCACGTCGGC TCGAATTACT CGCCCGCCGT GCCGAACGGC AACGAGCCAT CGACGCCGGT 
GAACGGCCTG ATTTTCTTCC TGAAACGGCC CATATCCGCG AAAGCGATTG GACGATAGCC 
CCCTTCCCCC CGCAACTCAA CGACCGCCGC GTTGAAATTA CCGGTCCGGT TGACCGCAAG 
ATGATTATCA ATGCGCTCAA CTCAGGGGCG AAGGTCTTTA TGGCCGACTT TGAGGACGCG 
AATACGCCAA CATGGCAAAA CCAGATCGAA GGTCAGATCA ATTTGCGTGA TGCTCTTCGC 
CGGACGATTA CCTATACCAG TCCTGAAGGC AAGTATTACG CACTCAACCC CAATCCGGCG 
ATCTTGTTCG TCCGCCCACG CGGCTGGCAT TTGCCGGAAA AGCATATGCT GGTCGATGGT 
GAGCCAATCG CCGGTGCCAT CTTCGATTTT GGCCTCTATT TCTTCCACAA TGCACAAACG 
GCTATCGAGG TACAGGGCGG CCCGTATTTC TACCTACCTA AGCTCGAAAG TCATCTTGAA 
GCGCGGCTGT GGAACGACAT TTTTGTGCTG GCCCAAGAAT TGCGCGGTAT TCCACGAGGG 
ACGATTAAAG CGACCGTGCT GATCGAAACG ATTCTGGCCG CGTTTGAGAT GGACGAGATT 
CTCTACGAGC TACGTGAACA CTCAGCCGGC CTCAACTGTG GACGTTGGGA CTATATTTTC 
TCGTGCATTA AGAAGTTTCG CAATGACCCC AATTTCTGTC TCGCCGACCG TGTGTTGGTT 
ACGATGACAA CGCACTTTAT GCGTTCGTAC TCGCTCCTCG CGATTAAGAC TTGTCATCGG 
CGCGGGGCGC ATGCGATGGG GGGAATGGCC GCGCAAATCC CGATTAAGAA CGACCCGGTC 
GCAAATGAAG CAGCGTTAGC CAAGGTGCGT GCCGATAAGG AGCGTGAGGC AAACGATGGG 
CATGACGGTA CCTGGGTGGC TCACCCCGGC CTCGTCCCTG TCGCGATGGA GGTCTTCGAC 
CGCCTGATGC CCACTCCCAA TCAGATTAAC CGCCAACGCG ATGATGTCCA CGTGACGGCC 
GCCGATCTGC TGGCCTTTGG TCCGAGTGAA CCGATTACCG AGCAGGGACT ACGGCTCAAC 
ATCAATGTCG GGATTCAATA CCTCGGCGCA TGGTTGGCCG GTAATGGGTG TGTGCCGGTC 
TTTAACCTGA TGGAAGACGC GGCGACTGCT GAAATATCGC GCGCTCAGAT CTGGCAGTGG 
ATCCGCAGCC CGAAGGGAGT GTTGGCGGAT GGTCGTAAAG TGACCGTGGA ACTGTTCCGG 
CAAATGCTTC CCGAAGAACT GGCGAAGGTG CGCGAGATTC TCGGCCCGGC CTACGAAGAT 
GGTCGCTACG GAGAGGCCGC CGAACTGTTC GATGAAATTA CCACCGACCC AAACTTCGTT 
GAGTTTCTGA CGTTGCCGGC ATATGACCGT ATTCCGTAA

Protein sequence

MTTPHFPAGV TITAPITPEY AEILTPEALE FLATLHRRFN ARRLELLARR AERQRAIDAG 
ERPDFLPETA HIRESDWTIA PFPPQLNDRR VEITGPVDRK MIINALNSGA KVFMADFEDA 
NTPTWQNQIE GQINLRDALR RTITYTSPEG KYYALNPNPA ILFVRPRGWH LPEKHMLVDG 
EPIAGAIFDF GLYFFHNAQT AIEVQGGPYF YLPKLESHLE ARLWNDIFVL AQELRGIPRG 
TIKATVLIET ILAAFEMDEI LYELREHSAG LNCGRWDYIF SCIKKFRNDP NFCLADRVLV 
TMTTHFMRSY SLLAIKTCHR RGAHAMGGMA AQIPIKNDPV ANEAALAKVR ADKEREANDG 
HDGTWVAHPG LVPVAMEVFD RLMPTPNQIN RQRDDVHVTA ADLLAFGPSE PITEQGLRLN 
INVGIQYLGA WLAGNGCVPV FNLMEDAATA EISRAQIWQW IRSPKGVLAD GRKVTVELFR 
QMLPEELAKV REILGPAYED GRYGEAAELF DEITTDPNFV EFLTLPAYDR IP