Gene Cagg_1562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1562
Symbol
ID	7267339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1910937
End bp	1912094
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	643566404
Product	3-dehydroquinate synthase
Protein accession	YP_002462900
Protein GI	219848467
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.171072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTGCAC CGCTGAAAGA TAGTTCAATT GTTATGACAA CTACGCTCAC CGTCACTACC 
AGCACGACCC AGTATCCGGT GATTGTCGGC GCCGGCGTAC TGGCGACCCT CGGCGACCGG 
CTCACCGAGC TAGGACTACG CGGTACGCTC TGGCTGGTCG CCGACGAACA TCTAGCAGCC 
GTCGCCGAGC AGACTACGAC AATGCTACAG GCCGCCGGTT ATCGCGTCCA CACCATCACC 
GTCCCTTCTG GAGAAACGAG CAAATCGTTC ACCGAACTAC ACCGGCTCTA CGATTGGATG 
ATCGAGAACG GCATCGAACG ACGTGACGCC GTGCTTGCGC TTGGTGGTGG TGTGATCGGC 
GATCTGGCCG GCTTTGCTGC GGCTACCATC TTGCGCGGTG TGGCTCTTGT ACAATTACCG 
AGCACTCTTT TGGCGATGGT CGATGCTGCG GTCGGCGGCA AAACCGGAAT TAATCACCCA 
TTGGGCAAAA ACCTGATCGG TGCGTTTCAC CAACCCCGGC TGGTGCTGGC CGACACCAAC 
CTGCTGGCGA CACTGCCGCC CCGTGAGTTA CGCGCCGGTT GGGCAGAGGT GATCAAACAC 
GGGGTCATTC GCGACGCCAG CCTGTTTACC GCCCTCGAAG ATCTTGCCGC TACCCGCGGA 
TGGAACGCCG CGCATCCCGC CGGATGGAAC GCTGCCGATG CAGAACTCAC CACTTATCTG 
ACCGAGATCA TTGCTCGTGC CGTCGCGGTG AAAGTTGCTG TGGTCTCGAA CGATGAGTTC 
GAGCGCGGTG AACGGATCAC GCTCAACTAT GGGCATACCA TCGGCCACGC TATCGAACAA 
CTGCTCGGCT ACCGCCTACT GCACGGCGAA TGCGTCGCGA TTGGGATGGA TGCAGCAGCG 
CGGATTGCCG TCGCTCTCGG TCTGTGTCCA CCCGCATTGG TAGAACGACA GCGCGCCCTG 
CTTGCAGCCT ACGGCCTCAC CGTTACGATA CCGGACGAGA CTGACCACAC TGCGATTCTG 
CGTCTCATCA CGCGCGACAA GAAGGTACAG GCCGGGAAAG TACGGTGGGT CTTGCCGACG 
ACCATCGGGC AGGTGGTTGT ACGCAGCGAC GTACCTATCG AGGTGATCGA ACAGGTATTA 
TCATCGTCGG CGGGATAG

Protein sequence

MIAPLKDSSI VMTTTLTVTT STTQYPVIVG AGVLATLGDR LTELGLRGTL WLVADEHLAA 
VAEQTTTMLQ AAGYRVHTIT VPSGETSKSF TELHRLYDWM IENGIERRDA VLALGGGVIG 
DLAGFAAATI LRGVALVQLP STLLAMVDAA VGGKTGINHP LGKNLIGAFH QPRLVLADTN 
LLATLPPREL RAGWAEVIKH GVIRDASLFT ALEDLAATRG WNAAHPAGWN AADAELTTYL 
TEIIARAVAV KVAVVSNDEF ERGERITLNY GHTIGHAIEQ LLGYRLLHGE CVAIGMDAAA 
RIAVALGLCP PALVERQRAL LAAYGLTVTI PDETDHTAIL RLITRDKKVQ AGKVRWVLPT 
TIGQVVVRSD VPIEVIEQVL SSSAG