Gene Cagg_0662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0662
Symbol
ID	7266913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	815587
End bp	817632
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	58%
IMG OID	643565523
Product	Shikimate/quinate 5-dehydrogenase
Protein accession	YP_002462033
Protein GI	219847600
COG category	[R] General function prediction only
COG ID	[COG5322] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0104064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000472149
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGCGAG TAGTTAGCAT TAGTCTCGGT TCGGCGCAGC GTGACTACCA AATCACGGCA 
ACGGTGCTTG GCCGGCAGGT TGAGGTGCGC CGGATTGGCA CTAACGGTGA TGTAGCCCAG 
GCGATGGCCT TGATCCGGGA ATTTGATGGC AACGTTGACG CAATCGGTCT CGGTGGGTTG 
ACGCCGGTGT TTCGGATTGG TCGTGCCCGT TATCCGCATC AAGAAGCGAT CCATATCGCA 
GCGCAGGCAC GGCGGACGCC GGTAGTTGAT GGTGGTGTCG TCAAGGCAAT CTTGGAACGA 
TGGGCGATTG CGCAGGCAGT GCGTCAGATC CCTTCATTAG TGCGGTACAA GCGCGTATTG 
ATTGCCAGTG GCGTCGAACG CTATCAATTG GCAGCCGCAA TCGCTCAGTA CGAACCAGAA 
TTGCGTTTTG CCGATCCGAT TATCCACGCC GGTCTTCCCT TCTTACCGCC ACCGCGTTCG 
CTTGAACAAC TCGAATTGTA CGCGGCTACT GCGCTACCGC TGCTCGCTCT CCTCCCTTAC 
CGTTTTATCC ACCCGGTCGC GCTCGGTCAA GAAGGTTATG ACCCACGTGC TGCCGCTCTC 
TTTCAATGGG CTGATGTCAT TGCCGGCGAT TTTGCCTTCA TCCGTCGCTT TGCCCCGGCC 
GACCTGACCC GCAAAGCAGT TATCACCGAT GATCCGTCTC CGGCGGAAAT CGAGGACTTG 
CGCCGGCGCG GAGTGACGAC CTTGGTGACG ATGACGCCAC CCCTGAGTGA CGAACGTCCC 
TTTCTGGCGG CTGATGCGAT CGAGGCGATC ATTACGGCGA TTACCGAGAG TACGCGCCAG 
CCCGGTGATG CCGAAGTCAT CGATTTTATT ACCGCTGCCG GCTGGGGACC GACGGTGCAA 
GACCTTAATC CGCGCCCGAA GCCGCGCTTT GCCTTTGTCA TCCATCCGTT GCGGACCGAA 
CTGATTGCCA ATCACCGCTG GTTCCGTTGG ACGCGCTACC TGCCGCCGCG TTTGGTGGAG 
CTAGTTGCTG CCGAGTTTCC ACCGCTCTAC CTGTCGCGGA TCCGTGGGAT TCGCTCGAAA 
GCAACCGGTG AAGAGGTCGA GGGTATCCTC CTCACCCTCG GCACGACTCC GCGCGAGATG 
ATGCGTCGAC CACCGAGTTT TACTTATCGC CGGTTGATCA AAGCGGCGCG GATGGCCGAA 
CGGATGGGGG CGCAGATTAT GGGCTTGGGC GCATTCACCT CTGTCGTCGG TGATGCCGGG 
ATTACCGTAG CCCAGAAGTC CAACATCGGC ATCACTTCAG GTAATTCGTT GACGGTGGCC 
GCAACGCTTG AAGCGGCCAA GCAGGCAGTG TTACTGATGA AGGGGGGCAA ACCGGAACAT 
GTGCGGGCCG TCGTGATTGG GGCAACCGGT TCGATTGGCG CCGTCTGTGC CCGCTTGCTG 
GCACAGGCAG TACACGATGT CGTACTGGTT GCACCGCGTG CCGAACGGTT GATCGCGCTT 
AAGAAACAGA TCGAATCCGA GACGCCGGGA GCGCGGGTTG TGGCCGCGAC CTATGCTGAT 
GCCTATCTCG GTGACGCCGA TTTGATTATC ACTACGACCA GTGCTCTGAC CGGTAAAGTC 
ATTAATGTCG ATAAACTCAA ACCCGGAGCA GTGGTGTGCG ATGTGGCTCG CCCACCTGAT 
GTAAAAGAGG AAGATGCACG GCGACGGCCC GATGTACTGG TGATTGAGAG TGGTGAGATC 
GTGTTACCCG GTGAGCCGGA TTTTGGCTTT GATATCGATA TGCCACCCGG TACGGCCTAC 
GCCTGTCTCG CCGAAACGGC GCTACTGGCA ATGGAAGGCA AGTTTGAAGA TTATACCCTT 
GGTCGCAATA TCGAAATCGA GCGGGTAAAA GAGGTTTACC GACTTTGGAA AAAACACGGC 
CTCGAACTCG CTCGTCTGCG CTCGTTTGGG GTGTATGTAA CCGACGAGAT GATCGCCGAG 
AAGCGGCGGT TAGCCGAAGA ACGACGGCGT CAGTTGGGCT TGCCGGCGGA TAAGGTGTGT 
GAGTAG

Protein sequence

MKRVVSISLG SAQRDYQITA TVLGRQVEVR RIGTNGDVAQ AMALIREFDG NVDAIGLGGL 
TPVFRIGRAR YPHQEAIHIA AQARRTPVVD GGVVKAILER WAIAQAVRQI PSLVRYKRVL 
IASGVERYQL AAAIAQYEPE LRFADPIIHA GLPFLPPPRS LEQLELYAAT ALPLLALLPY 
RFIHPVALGQ EGYDPRAAAL FQWADVIAGD FAFIRRFAPA DLTRKAVITD DPSPAEIEDL 
RRRGVTTLVT MTPPLSDERP FLAADAIEAI ITAITESTRQ PGDAEVIDFI TAAGWGPTVQ 
DLNPRPKPRF AFVIHPLRTE LIANHRWFRW TRYLPPRLVE LVAAEFPPLY LSRIRGIRSK 
ATGEEVEGIL LTLGTTPREM MRRPPSFTYR RLIKAARMAE RMGAQIMGLG AFTSVVGDAG 
ITVAQKSNIG ITSGNSLTVA ATLEAAKQAV LLMKGGKPEH VRAVVIGATG SIGAVCARLL 
AQAVHDVVLV APRAERLIAL KKQIESETPG ARVVAATYAD AYLGDADLII TTTSALTGKV 
INVDKLKPGA VVCDVARPPD VKEEDARRRP DVLVIESGEI VLPGEPDFGF DIDMPPGTAY 
ACLAETALLA MEGKFEDYTL GRNIEIERVK EVYRLWKKHG LELARLRSFG VYVTDEMIAE 
KRRLAEERRR QLGLPADKVC E