Gene Cagg_2815 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2815
Symbol
ID	7267521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3456847
End bp	3457905
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	58%
IMG OID	643567636
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002464113
Protein GI	219849680
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.700951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGTCG TAATGGAAGC ACACGCGACG GTGGAGCAGA TCGAAGCTGT TTGCGCCGAG 
ATTCGGGCGA TGGGGTTTAC GCCACACCCA ATGCCCGGCC CGACCCGAAC TGCCATCGGG 
ATTACCGGTA ACCAAGGCCC AATCGAGCAG GCCGGGCGGT TGCAGCGGTT GCCCGGTGTG 
AGTCAGTTGA TACGGGTAAC CGCACCCTAC AAGCGCGTCA GTCGTGAGTT TAAAGAACTC 
GATACGGTGG TGGAGGTCGG TGGTGTACCG ATCGGTGGGG CCGGTATTGC GATAATTGCC 
GGTCCATGTA CGGTAGAAAG TCGAGAACAG ACTCTCAACG TTGCACGGGC AGTACGTGCG 
GCCGGTGCGG TCATGCTACG CGGTGGAGCG TACAAGCCGC GTACCTCACC GTATTCTTTT 
CAGGGCTTAG GCGAAGCCGG CTTACGCATA TTAGCCGAAG CGCGTGAACT GACCGGTCTG 
CCGGTGGTGA CCGAGGTCAT GGATACCGAG ACGTTGCCGT TGGTGGTTGA ATATGCCGAC 
ATGTTGCAGA TCGGTGCGCG CAATATGCAA AATTATTCGC TGTTGCGGGC AGTTGGACGC 
ACTCAGCGAC CTGTCTTGCT GAAACGTGGA TTTGCCGCCA CGGTGAAAGA TTTGCTCTTG 
GCGGCAGAAT ACATTTTGGC CGAGGGGAAT CCAAACGTCG TACTGTGTGA GCGAGGTATT 
CGTACCTTCG ACGATAGTTT GCGCTTTACC CTTGATCTGG GGGCCGTACC GTTGATCAAA 
CAGCTCTCGC ATCTACCGGT GATCGTCGAT CCATCGCACG CGAGTGGGCG GGCCGATCTT 
GTCATTCCCA TGGCGCGTGC CGCGTTAGCA GCCGGCGCCG ATGGTTTGAT CGTTGAAGTA 
CACGATAATC CGGCCTACGC AGTTTGTGAT GGGACGCAGG CGCTTGTACC GGACAGCTTT 
GCTGCGATGA TGCATCAGCT TGCACGCATA GCGGCAGCAG TGGAACGTCC GTTGCTGAGT 
CGGGTTGAGG TGAACGGTGG ACACACGACG TTGGCGTGA

Protein sequence

MLVVMEAHAT VEQIEAVCAE IRAMGFTPHP MPGPTRTAIG ITGNQGPIEQ AGRLQRLPGV 
SQLIRVTAPY KRVSREFKEL DTVVEVGGVP IGGAGIAIIA GPCTVESREQ TLNVARAVRA 
AGAVMLRGGA YKPRTSPYSF QGLGEAGLRI LAEARELTGL PVVTEVMDTE TLPLVVEYAD 
MLQIGARNMQ NYSLLRAVGR TQRPVLLKRG FAATVKDLLL AAEYILAEGN PNVVLCERGI 
RTFDDSLRFT LDLGAVPLIK QLSHLPVIVD PSHASGRADL VIPMARAALA AGADGLIVEV 
HDNPAYAVCD GTQALVPDSF AAMMHQLARI AAAVERPLLS RVEVNGGHTT LA