Gene Cagg_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1646
Symbol
ID	7268948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2006569
End bp	2008881
Gene Length	2313 bp
Protein Length	770 aa
Translation table	11
GC content	56%
IMG OID	643566488
Product	AAA-4 family protein
Protein accession	YP_002462983
Protein GI	219848550
COG category	[R] General function prediction only
COG ID	[COG0613] Predicted metal-dependent phosphoesterases (PHP family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACAG TAAGAGAAGA GCGCAACGGG ATGCGCTGGA TTCGGATTGA TTTGCACCTG 
CACACGCCTG CATCTGAGGA TTACGCCGAA CCAAACGTTT CTTACCTTGA CATTCTTCAA 
GAAGCTGAGC GTCGCGGTCT TGAGATTATC GCCTTTACCG ACCACAATAC GGTTGCCGGC 
TACGAGCAGT TTCAGCGCGA GATTGAGTTT CTGACGACCC TGGAAAAGGC CGGACGGTTG 
ACCGATGATG AAGAAGCTCG TTTGGCTGAG TATCGTCGGT TGCTCGATAA GATCACCGTC 
TTGCCCGGCT TTGAGTTTAC GTCGCACTTC GGTGCCCATA TCCTCGGTAT CTTTCCGCCG 
AACCGCCCGC TTAGCTTGAT CGAGGCTACG TTGTTGCAGC TCGGTATTCC CGCCGAAGTT 
CTGAAGGGTG GGGTGTGTAG TGTCGCTAAT ACCCGGCACG TGACCGAGGC ATACGAGATT 
ATTCATCGCG CTGGCGGTCT TGTGATCGCG GCGCATGCCA ACGGGCCAAA CGGAGTGATT 
ACCGAAACCC TCCGTATGGG GACAAGTGGC CAGGCTCGTG TGGCGGTGAC CCAAAGCCCC 
TATCTCCACG CACTGGAGTT TATCAATTTC TATACCGATC ACGAGAAGTT TACCTCACCC 
GGTTTTTACA ACGGTAAGAC CGAGCATTAC GAGCGGCGGA TGTTCTGTAT TCAGGGTAGC 
GATGCACATC GGCTGCGTCG CTCTGCTGAG TCTGATGCCC AAGCGACCCA CCGCCACGGC 
ATTGGTGACC GCTATTTTGA GGCGCTGTTG CCCGACCGTA GTTTTGAAGC CCTGAAGATG 
CTCTTTACCG GTCAGGATTT TGATCGAGTG CGGGTGCCGA AGCGTGATCA GAAGCAGTGG 
TCACTCGATG TCGTGCGCTT TAGTGGGAGT ACCGACCGCC AAATCTTGCG CGCTGTTCCC 
GATCCGACAA CGGCAGCCGC GCTCTGGCCT GATGTGGCGG CGTTGGCAAA TATCGGTGGT 
GGGGTGCTCG TGATCGGCTG TGAGCCTGGG GGTAAGGTGA TCGGTGTTGA ACGGCCCGAT 
CAGCTTACCG AGTCGTTACG GCAAAGTGTG CAAGAGCATA TTACGCCGCT GCCCTACTTG 
TCGTTTGAGT TGATGCACTA CGAAGGGCAA GACGTGATCC GCGTTGAGGT CAAAGCGCAG 
GATCCGCCAC CTTACGTAGG GAGTAACGGT ACGATCTACA TCCGGCGCGA TAACAAGACG 
TTTCCTGCGA ACCGCAGTGA AATTATCCAA TTGTGTCGCC AGGCGATTGC ATCCGGTGAA 
CCTTCATCAC TCGATAACGG CGAGACGTTG GAACTACCGC GTTCGGGCGT CGAGATTGTC 
AGTAGCCAGC GTCGTGGTGG TACGTGGGTG TATGAAGTGC GTGATCTGCG TACTACCGCC 
GGTGTGACCC GTGATCGTGC CCAAGGGTTG TGGGCTTACG CAATCGATCG CCACGAAGAT 
TTGCGTGATG GTCGGCTCGA TCTCCAGAGT CAAGTGCGTT GGCGCGGCCG GCTCGGTCTC 
TGGCGGGCGT ATCGCCAAGG TTCGCGTGTG AAGTACGATC TGGTCCATCG TGACCCGAAT 
GGTGTGATTG ACCATATTTT CTACGGTGTG AGCGATTGGG GTCTCGGTGA AGCGTGGATG 
AGCCTTTTGA ATGAAGCCGG TGCGCGCATT GAGACGGAGA CAGCCGATTT CGATCAGGAA 
GATGAGATGG AGGTGCCGCC GCCACCAGAT ATTGAACCAT GGGGGGAACG GCGGATCCGC 
TGGCGTGGTC GTGGTGGTTT AGTACGCATT TTCCTCGGTG ACGATGGGCA ACCGCGGTTT 
GATCTGGTGA TGAAGGATAA AGAAACCGGT GTCGTGCAAG AATACAACAA TGTGCCGCGC 
GAGAAGCTTT CCGAGGCATG GCTGGCGTTG ATCCGCGTTG CCCGTCCGCG TACCGGTATC 
GAGGTGGTAA GTGCTAGTCG TAGCGAAGAT GGCGATTGGC TCTACGTCTT CCGTAATCTG 
CGTACCGGCG AGATTAGTAG TGCGCCATGG CGGTTGCAAG ATATCGAACC CGGTACGGTG 
CGTGAGTATG CGGCGCGTAT GTACCACCAA GATATTCCGC TCGATCAAGC GAAGGTGCGC 
TGGTGGGGAA ATATTGGCTA TTTGCGCCCA ATGCGATCGC AGGTCGATTT GGTCTATGTT 
GATGAGTACG GCATGACTCA CATCTACTAC GCTGCCCGGC GTGATGAATT GACCGGTGAG 
TGGCGAGAGT TGCTCCAACT GTATGGCGAG TAG

Protein sequence

MSTVREERNG MRWIRIDLHL HTPASEDYAE PNVSYLDILQ EAERRGLEII AFTDHNTVAG 
YEQFQREIEF LTTLEKAGRL TDDEEARLAE YRRLLDKITV LPGFEFTSHF GAHILGIFPP 
NRPLSLIEAT LLQLGIPAEV LKGGVCSVAN TRHVTEAYEI IHRAGGLVIA AHANGPNGVI 
TETLRMGTSG QARVAVTQSP YLHALEFINF YTDHEKFTSP GFYNGKTEHY ERRMFCIQGS 
DAHRLRRSAE SDAQATHRHG IGDRYFEALL PDRSFEALKM LFTGQDFDRV RVPKRDQKQW 
SLDVVRFSGS TDRQILRAVP DPTTAAALWP DVAALANIGG GVLVIGCEPG GKVIGVERPD 
QLTESLRQSV QEHITPLPYL SFELMHYEGQ DVIRVEVKAQ DPPPYVGSNG TIYIRRDNKT 
FPANRSEIIQ LCRQAIASGE PSSLDNGETL ELPRSGVEIV SSQRRGGTWV YEVRDLRTTA 
GVTRDRAQGL WAYAIDRHED LRDGRLDLQS QVRWRGRLGL WRAYRQGSRV KYDLVHRDPN 
GVIDHIFYGV SDWGLGEAWM SLLNEAGARI ETETADFDQE DEMEVPPPPD IEPWGERRIR 
WRGRGGLVRI FLGDDGQPRF DLVMKDKETG VVQEYNNVPR EKLSEAWLAL IRVARPRTGI 
EVVSASRSED GDWLYVFRNL RTGEISSAPW RLQDIEPGTV REYAARMYHQ DIPLDQAKVR 
WWGNIGYLRP MRSQVDLVYV DEYGMTHIYY AARRDELTGE WRELLQLYGE