Gene Cagg_1109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1109
Symbol
ID	7268562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1365684
End bp	1367378
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	58%
IMG OID	643565951
Product	dihydroxy-acid dehydratase
Protein accession	YP_002462455
Protein GI	219848022
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000387087
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAGCGATA ATCGCCGTAG TCGTATGATT ACCGAAGGCC CACAGCGTTC ACCCAATCGG 
GCAATGCTGC GCGCGGTCGG GTTTGGCGAC AACGATTTTA CGAAGCCGAT CGTGGGAGTG 
GCTAACGGTC ACAGTACGCT GACACCGTGC AACGCCGGCT TAGGGGCGTT GGCAGCGCGG 
GCGGAAGCCG CTATTCGTGC CGCAGGAGGT ATGCCGCAGA TCTTCGGCAC GATCACGGTC 
AGCGATGGTA TCTCGATGGG GACTGAAGGG ATGAAGTATT CTTTGGTCAG CCGCGAGGTG 
ATTGCCGATT CGATTGAGAC GGTCGTCAAC GCACAGCGGA TGGACGGAAT CCTTGCGGTG 
GGTGGCTGCG ATAAGAACAT GCCCGGCGCC TTAATTGCCA TGGCCCGGCT CGACATTCCG 
GCCATCTTTG TCTATGGTGG TACTATCAAA CCCGGTCATT ACAAAGGCCG TGACTTGACC 
ATCGTCAGCG TGTTTGAGGC AGTTGGCGAA TACAGTGCCG GTCGGATCGA CGAACACGAG 
TTGCTCGAAA TCGAGCGTCA CGCATGCCCC GGCGTCGGTT CGTGTGGTGG TATGTACACT 
GCCAATACGA TGTCGTCGGC AATTGAAGCG CTGGGCTTGA GTTTACCCGG CTCTTCAACC 
ATGGCTGCCG AAGACGAGGA AAAGGCGATC AGCGCAGCTC GTTCCGGCGA GGTGTTAGTT 
GAGGCCATCC GCGCCAATCG CACAGCGCGC CAGATGTTGA CCCGCAAGTC GTTTGAGAAT 
GCGATTGCAG TAGTGATGGC GTTAGGTGGC TCGACCAACG CCGTTTTGCA TCTGCTGGCG 
ATTGCCTATG CTGCCAACGT ACCGTTGACC ATCGATGATT TTGAGACGAT CCGCCAGCGG 
GTACCGGTGC TCTGCGATCT CAAGCCATCG GGCCGCTATG TGGCGACCGA TCTCCACCGT 
GTCGGTGGTG TACCGCAGGT GATGAAGATG TTGTTGAATG CCGGCTTACT CCACGGTGAT 
TGTATGACGA TTACCGGACA GACAATCGCT GAGGTGCTGG CCGATGTACC CGACGAGCCG 
CCGGCCGATC AAGATGTCAT CCGCCCCTTT CATAAACCCC TCTATCCGCA AGGACATTTG 
GCCATCCTCC GTGGTAATCT GGCCGAAGAA GGCTGCGTTG CGAAGATTAC CGGTATTAAG 
CAGCGCTCGA TTACCGGACC GGCCCGTGTT TTCGATGCCG AAGAGGAATG TCTCGAAGCG 
ATTTTGAGTG GCAAGATTAA GCCGGGCGAT GTCGTGGTGA TCCGGTACGA AGGGCCGAAG 
GGTGGTCCCG GTATGCGTGA AATGCTCGCT CCGACATCGG CGATTATCGG TGCCGGTTTG 
GGCGATAGCG TTGGCCTGAT TACCGACGGA CGCTTCTCTG GTGGTACGTA TGGCTTGGTG 
GTCGGTCATG TTGCCCCTGA AGCGGCGGTT GGTGGCACCA TTGCCCTGGT CGAAGAGGGT 
GATAGTATCA CGATTGACGC CGATGCCCGT CTCTTGCAGC TCAATGTCTC GGACGAAGAG 
TTGGCACGAC GCCGTGCTGC GTGGCAACCC CGTCCGCCAC GCTATACCCG TGGTGTATTG 
GCGAAGTATG CCAGGCTGGT GTCGTCGGCT AGCCTTGGTG CAGTGACCGA CCGCTTCGAT 
GGCGAGTCGG CGTAA

Protein sequence

MSDNRRSRMI TEGPQRSPNR AMLRAVGFGD NDFTKPIVGV ANGHSTLTPC NAGLGALAAR 
AEAAIRAAGG MPQIFGTITV SDGISMGTEG MKYSLVSREV IADSIETVVN AQRMDGILAV 
GGCDKNMPGA LIAMARLDIP AIFVYGGTIK PGHYKGRDLT IVSVFEAVGE YSAGRIDEHE 
LLEIERHACP GVGSCGGMYT ANTMSSAIEA LGLSLPGSST MAAEDEEKAI SAARSGEVLV 
EAIRANRTAR QMLTRKSFEN AIAVVMALGG STNAVLHLLA IAYAANVPLT IDDFETIRQR 
VPVLCDLKPS GRYVATDLHR VGGVPQVMKM LLNAGLLHGD CMTITGQTIA EVLADVPDEP 
PADQDVIRPF HKPLYPQGHL AILRGNLAEE GCVAKITGIK QRSITGPARV FDAEEECLEA 
ILSGKIKPGD VVVIRYEGPK GGPGMREMLA PTSAIIGAGL GDSVGLITDG RFSGGTYGLV 
VGHVAPEAAV GGTIALVEEG DSITIDADAR LLQLNVSDEE LARRRAAWQP RPPRYTRGVL 
AKYARLVSSA SLGAVTDRFD GESA