Gene Cagg_3506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3506
Symbol
ID	7266434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4273720
End bp	4274940
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	643568314
Product	amidohydrolase
Protein accession	YP_002464781
Protein GI	219850348
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC TCTTCACCAA CGCGACTGTT GTCTTACCCG ATCGAGTCAT TGAAGAGGGT 
TGGGTGGTGA TCGACCGAGG CCGGATCGGG GCGATTGGAC GCGGCAAGCA CCCGTATGCG 
GCAACGATGC CGCAGTTTGA TCTCGACGGG GCGTATTTGT TGCCCGGCCT GATCGATCTG 
CACTGTGACG CTATCGAAAA ACTCGTCCAA CCTCGGCCCG GTGTCGAGAT TGAAGTTGGT 
ATCGCATTGC ACGCTGCCGA CCGGCTCTTG CTAGGGTGCG GCGTGACCTG CCAATTCCAC 
GCCTTATCGC TCGACGACGC CGAATTCGGT GTGCGCAGCG ATCGCTTTGT CAGCGACTTC 
CTTCACCAGC TCAGCGCCGA ACGGCACTGC GGCGCACGCC ATCTCGTGCA TGCCCGGGTC 
GAGGTCAGCA GTGAGCGCGG CCTTGAGGCG CTGAAGACAA TGCTGGGCCA TCCCTTATTG 
CGGCTGGTCT CAATCATGGA TCACAGTCCG GGGCAGGGGC AATATACCAC CGAAGCTGCG 
TTTCGCCATT ACGTCGCCAA GACCACTGGG CGCAGCGATG CCGAGATCGA CGAATTGTTG 
GCCCGCAAGC GAGCGGCGCA GAGCGATGTG CCCAACCGGA TCCGGCAAGT GATTGCATGG 
GCGACGAAGT ATGGCTTGCC GGTCGCCAGC CACGATGACG ATACACCTGA ACGGGTGGCG 
CAGTGGGTGG AGTTGGGGGT GAAACTTGCC GAATTCCCCA CCACCTTAAC CGCGGCCCAA 
ACGGCGCATA CCGCCGGGAT GGCGGTGGGG ATGGGAGCGC CGAACGTGCT GCGCGGCAAG 
TCAAGTGGCG GCAACCTGAG CGCGTTAACC GCAATCGAGG CCGGCGTTGT TGACTGGCTG 
TGCGCCGACT ACTATCCGGC CTCGCTATTG CCGGTCATCT TCCGCCTCGC CGACCGCGGT 
ACCCTTAGCT TGCCCGCCGC AGTGGCGCTA GTCAGCCATC ACCCGGCCTG CGCCGCCGGC 
ATCGGCCATC TGATCGGCAG TATCCAGCCG GGGCTGATCG CCGATCTGAT CGTCGTGCGC 
CGGATGCCCG ATCCGGTGGT GCAGCAGGTC TTTGTCAGCG GGAAGCCGGT GTACACCTTG 
CAGGAGCAGA ACGAACCGCT ACCCTTCCCC GACCGCCACC AGATGGGTGA AGAATTGCCG 
GCCCCACGCG AGCATCGTTA G

Protein sequence

MQYLFTNATV VLPDRVIEEG WVVIDRGRIG AIGRGKHPYA ATMPQFDLDG AYLLPGLIDL 
HCDAIEKLVQ PRPGVEIEVG IALHAADRLL LGCGVTCQFH ALSLDDAEFG VRSDRFVSDF 
LHQLSAERHC GARHLVHARV EVSSERGLEA LKTMLGHPLL RLVSIMDHSP GQGQYTTEAA 
FRHYVAKTTG RSDAEIDELL ARKRAAQSDV PNRIRQVIAW ATKYGLPVAS HDDDTPERVA 
QWVELGVKLA EFPTTLTAAQ TAHTAGMAVG MGAPNVLRGK SSGGNLSALT AIEAGVVDWL 
CADYYPASLL PVIFRLADRG TLSLPAAVAL VSHHPACAAG IGHLIGSIQP GLIADLIVVR 
RMPDPVVQQV FVSGKPVYTL QEQNEPLPFP DRHQMGEELP APREHR