Gene Cagg_3079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3079
Symbol
ID	7269496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3741088
End bp	3742116
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	643567899
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_002464373
Protein GI	219849940
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.544275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.000000030667
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGCGAAATC TTCTCGTGAC CGGTGGAGCC GGCTTTATTG GTAGCAACTT CGTGCATTAT 
ATGCTCGGCA AATACGACGA TTATCGCATC GTCGTGTACG ATAAGCTGAC GTATGCCGGT 
AATCTTGCTA ATCTGGCACC GGTTGCCAAC GATCCGCGGT TTGTTTTTGT GCGTGGCGAC 
ATCTGTGATA TCGATGCAGT GCGGGAAACG GTGCGCACGT ATGATATCGA TACCATCATC 
AATTTTGCTG CCGAGACGCA CGTCGATCGC TCAATCATGG CGCCCGATGC CGTAGTGCGC 
ACCAATGTAA ACGGTACGTG GGCATTACTG GAAGTGGCAC GTGAACTGAA ACTCGAACGT 
TTTCACCAGA TTAGTACCGA CGAAGTGTAC GGCGCTATTC CGGCCCCGCG CCGTTCGCGT 
GAGGGTGATC CGCTCGAACC ACGCAGTCCC TATTCGGCCA GCAAAGCCGG AGCCGAACAT 
CTCGTCTACG CTTACTACAT CACCTACGGT GTACCGATCA CGATTACTCG CGGCTCGAAT 
AACATCGGTC CCTATCATTA TCCCGAAAAG GCGGTACCCC TCTTCACCAC CAACGCCATC 
GATAATCTAC CCTTGCCGAT CTACGGTGAT GGTCTCCAGG TACGCGATTA TCAGTACGTG 
CTCGATCATT GTGAAGCCAT CGATGTCGTG CTGCACAAAG GCCAGATCGG TGAGGTCTAC 
AACGTAGGGA CCGAGGTCGA GACGCCGAAT ATCGAGATGG CGCGCAAGAT TCTCGATATT 
CTCGGCAGGC CGCATAGTCT CATTCAGCAC GTTGCCGACC GTGCCGGTCA TGATCGCCGC 
TATGCCCTCG ATTGCTCGAA ACTGCGCGCG CTTGGGTGGC GTTCACGCCA TACCTTCGAT 
GAAGCGCTGG AAAAGACGGT ACGCTGGTTT GTTGAAAATG AAGCGTGGTG GCGCCCGATC 
AAGTCAGGTG AGTATATGGA ATACTACCGT CGCCAGTATC TTGAACGCAG TGGGTATCCG 
GTGGTGTAG

Protein sequence

MRNLLVTGGA GFIGSNFVHY MLGKYDDYRI VVYDKLTYAG NLANLAPVAN DPRFVFVRGD 
ICDIDAVRET VRTYDIDTII NFAAETHVDR SIMAPDAVVR TNVNGTWALL EVARELKLER 
FHQISTDEVY GAIPAPRRSR EGDPLEPRSP YSASKAGAEH LVYAYYITYG VPITITRGSN 
NIGPYHYPEK AVPLFTTNAI DNLPLPIYGD GLQVRDYQYV LDHCEAIDVV LHKGQIGEVY 
NVGTEVETPN IEMARKILDI LGRPHSLIQH VADRAGHDRR YALDCSKLRA LGWRSRHTFD 
EALEKTVRWF VENEAWWRPI KSGEYMEYYR RQYLERSGYP VV