Gene Cagg_2607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2607
Symbol
ID	7267198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3192080
End bp	3192889
Gene Length	810 bp
Protein Length	269 aa
Translation table	11
GC content	59%
IMG OID	643567433
Product	HAD-superfamily hydrolase, subfamily IIA
Protein accession	YP_002463912
Protein GI	219849479
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01457] HAD-superfamily subfamily IIA hydrolase, TIGR01457 [TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.988604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGCAT TCTCTGCAAT CCGCGCCGTA CTGTTCGATA TGGACGGTGT GCTCTACCGG 
GGGCAAACGC CGCTGCCCGG CGTCGCCGAT CTGTGGCAGT TTTTGCACGA TCACCAGATC 
GCCTTCGCCT GTGCGACTAA CAACGCTTCG ATGACGCCGC AGCAGTACGC GGCTAAGTTG 
GCTGCCATGG GCATAGTGCT GCCGGCAGAT CGCGTGATTA CGTCGGCCCA AGCAACTGCC 
CTGTATCTGC GTGATCACTA CCCGCCGGGT ACGCGCGTGT TTGTGGTCGG CATGCAGGGG 
TTACGCGCAG CATTGTTTGC CGATGGTTAC TTTGTCGAGG ATGACGACGC TCCGGAATTG 
GTTGTGCAGG GTGCCGATTT TACGCTCACC TACGAGCGGC TCAAACGGGC AACGCTACAT 
ATCCGGCGTG GCGCCCGCTT CATCTCTACG AATCCCGACC GCACCTTTCC CAGCGAAGAG 
GGTCTCATTC CCGGCGCCGG TGCAATTGCT GCCGCCCTCA CTGCTGCTAC CGATGTCTCA 
CCGCTGGTGA TTGGCAAGCC GGCGCCAACG ATGTTTCTGA TCGGCGCTAA GATGTTAGAT 
GCTCCTCCGT CCGCAACACT TGTGGTTGGT GATCGGCTTG ATACCGATAT TGCCGGTGCA 
ATCGCCGCCG GCATGCCGTC GGTGTTGGTG TTGACCGGCG TCAGTACAGT TGAAGAAGCT 
ACCACCGGCC CGATCCGGCC TGATCTGATC GTGGCTGATT TGCCTGAGTT GCTGGCCCGC 
TGGGCCGATG AATTATCGGC GCAACTGTAA

Protein sequence

MIAFSAIRAV LFDMDGVLYR GQTPLPGVAD LWQFLHDHQI AFACATNNAS MTPQQYAAKL 
AAMGIVLPAD RVITSAQATA LYLRDHYPPG TRVFVVGMQG LRAALFADGY FVEDDDAPEL 
VVQGADFTLT YERLKRATLH IRRGARFIST NPDRTFPSEE GLIPGAGAIA AALTAATDVS 
PLVIGKPAPT MFLIGAKMLD APPSATLVVG DRLDTDIAGA IAAGMPSVLV LTGVSTVEEA 
TTGPIRPDLI VADLPELLAR WADELSAQL