Gene Cagg_3347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3347
Symbol
ID	7267087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4059682
End bp	4060722
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	643568156
Product	tagatose 1,6-diphosphate aldolase
Protein accession	YP_002464627
Protein GI	219850194
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3684] Tagatose-1,6-bisphosphate aldolase
TIGRFAM ID	[TIGR01232] tagatose 1,6-diphosphate aldolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000326066
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTACAG TAAAAATGAC GCGCGGTAAA TTCGAGGGGA TCAAAGCCTG TGCTGATAAC 
AACGGCATTA TTGCTGCCGC AGCGATGGAT CAGCGCGGTT CGCTAAAAAA GGCGATTGCT 
AAAGCTCGTG GCGCCGATGC GTCAAATGAG GATTTAACCG TGTTCAAGAC GGCCGTTACT 
CGTATTCTGA CCCGTTATGC GAGTGCGATT CTGATGGACC CAGAGTACGG TTTGCCGGCA 
ATCGCCCAAC GTGCTCCGGG TACCGGTGTC TTGCTGGCTT ATGAGAAGAC CGGCTACGAC 
GCCTCGGTGC GTGGTCGTTT ACCCGACCTG CTCGATGTGT GGAGTGTGCG TCGCTTGAAA 
GAAGCTGGCG CTAACGCGAT CAAGATTCTG CTTTACTACA ATCCCTTCGA TGATCCGGCT 
ATCAACGAGA TTAAACACGC CTTTATCGAG CGGGTAGGCG CCGAGTGTGC TGCGAACGAT 
ATTCCCTTCT TCCTTGAGCC GATCGCCTAC GATGATACGG TTGGCGATGA GAAGAGCTTT 
GAGTTTGCGC TGGTGAAGCC CAAGTATGTC ACCGCCTATA TGGCCGAGTT CTCGAAGCCG 
CAGTACGGCG TCGATGTGCT TAAGGTCGAA GTGCCGGTGA ATGTGAAGTT TGTCGAGGGG 
ATGCGCGTAT TTAGCGGCCA GAAGGCCTAT AGCCGTGAAG AGGCGAAAGA GTATTTCCGG 
CAGGCTGCTG ATGCTGCCCG CAAGCCGTTC ATCTACCTGA GCGCCGGTGT ATCCGACGAA 
GTTTTCCGTG AGACACTCGA ACTTGCCGCC GAAGCCGGTA CACCCTTCGC CGGTGTGTTG 
TGTGGTCGGG CAACGTGGCA AGATGGTATT CCGGTCTATG CCCAGCAGGG TCTGGCTGCC 
CTTGAGGCAT GGCTTGAGGA TCGCGGCGTT GCAAATATTA CTGCACTTAA CGAGACTCTG 
GCGAAAGGCG CCAAGCCGTG GTGGACGATC TACGGTGGGC TTGAGAATAT CGAGGTAGTA 
GATCTGCCGG TTGTAAATTG A

Protein sequence

MATVKMTRGK FEGIKACADN NGIIAAAAMD QRGSLKKAIA KARGADASNE DLTVFKTAVT 
RILTRYASAI LMDPEYGLPA IAQRAPGTGV LLAYEKTGYD ASVRGRLPDL LDVWSVRRLK 
EAGANAIKIL LYYNPFDDPA INEIKHAFIE RVGAECAAND IPFFLEPIAY DDTVGDEKSF 
EFALVKPKYV TAYMAEFSKP QYGVDVLKVE VPVNVKFVEG MRVFSGQKAY SREEAKEYFR 
QAADAARKPF IYLSAGVSDE VFRETLELAA EAGTPFAGVL CGRATWQDGI PVYAQQGLAA 
LEAWLEDRGV ANITALNETL AKGAKPWWTI YGGLENIEVV DLPVVN