Gene Cagg_1110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1110
Symbol
ID	7268563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1367540
End bp	1368880
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	643565952
Product	nucleotide sugar dehydrogenase
Protein accession	YP_002462456
Protein GI	219848023
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.6072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000437012
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

GTGAAAAACA TCTGTGTTGT TGGTACCGGA TACGTTGGCC TGACGACCGG CGTTTGTTTC 
GCCGATCTTG GTCATTCGGT CACGTGTATC GAAATTGATC TCCAAAAGCT GGAACTGCTG 
CGCAGTGGCA AATCACCGAT CTATGAACCC GGCCTGGAAG AGTTACAGGA GCGCAATATG 
CGCGCCGGGC GGTTGCGCTT TACCGATGAC TATGCGGTCG GCATTCCTGA GGCCGAATTT 
ATCTTTATCA CCGTCGGTAC GCCGATGAGT GAAGATGGTT CGGCCGATCT GACGTATGTA 
AAAGCGGCTG CGCGCAGTAT CGGCAAGTAT CTGCGCTCCG GCTCGATCAT TATCGACAAG 
AGTACGGTGC CCGTAGGTAC CGGTGATATG GTCGAGAACA TCATCGCCGA ACACGCCGGT 
CCTGATGTCA AGTTTGATGT CGTCTCGAAC CCCGAATTTC TGCGCGAGGG CAGTGCGTTA 
AGCGACTTTT TCAAGCCTGA CCGGATAGTA TTAGGGGCGA AAAATCGTGA AGCAGCACAG 
CGGGTAGCTG CGTTGCACGA GACGCTTGGC GCACCGATTA TCATCACCGA TCTGCGTACC 
GCCGAGATGA TTAAGTACGC CTCAAATGCC TTCTTGGCGA CCCGTATTTC GTTTATCAAC 
GAGATTGCTC AAATCTGCGA GCGGTTGGGT GCTGATGTGC GAGAGGTGGC GCGCGGTATG 
GGCGCCGATA AGCGGATCGG GCCTCATTTT CTTGAAGCGG GTGTTGGCTA CGGCGGCTCC 
TGCTTCCCGA AAGATGTGCT GGCCCTGTAC CATATGGCCG CTTCGGCGGG TTGTCACCCG 
CAACTGTTGC AAGCGGTGAT GGATATTAAC AGCGATGCGC GGAAGCGATT TGTGAAGAAA 
GTCGAGACGG TACTCGGTGA TCTGACCGGT CGCTTGATCG GTGTGTTGGG TCTGTCGTTT 
AAGCCAAACA CCGATGATAT GCGTGAAGCG CCGAGCGTTG ACATTATCAA CGCACTGCTG 
AAGAAAGGGG CGCGGGTAAA GGCTTACGAC CCGGTCGCAA TGCCACGGGC AGAAGAGTTG 
TTGCCAACCG TAACGTTTAC CGCCACCGCC TACGATGTCG CAAAAGATGC CGACGCTCTG 
CTGCTCGTTA CCGAATGGAA TGAGTTTAAG CAACTCGACT GGCAACGGAT CAAACGCTAT 
ATGCGCCAAC CGGTAGTGAT CGATGGACGC AACCTCTACG ACCCGCGTGA GATGCGGAGC 
CTTGGCTTCA TCTACTGGGG TGTAGGCCGT GGCGAAGCGC CGGTGCCGTT GTGGGAAGAA 
GCAACGAATA TTGGTGATTA A

Protein sequence

MKNICVVGTG YVGLTTGVCF ADLGHSVTCI EIDLQKLELL RSGKSPIYEP GLEELQERNM 
RAGRLRFTDD YAVGIPEAEF IFITVGTPMS EDGSADLTYV KAAARSIGKY LRSGSIIIDK 
STVPVGTGDM VENIIAEHAG PDVKFDVVSN PEFLREGSAL SDFFKPDRIV LGAKNREAAQ 
RVAALHETLG APIIITDLRT AEMIKYASNA FLATRISFIN EIAQICERLG ADVREVARGM 
GADKRIGPHF LEAGVGYGGS CFPKDVLALY HMAASAGCHP QLLQAVMDIN SDARKRFVKK 
VETVLGDLTG RLIGVLGLSF KPNTDDMREA PSVDIINALL KKGARVKAYD PVAMPRAEEL 
LPTVTFTATA YDVAKDADAL LLVTEWNEFK QLDWQRIKRY MRQPVVIDGR NLYDPREMRS 
LGFIYWGVGR GEAPVPLWEE ATNIGD