Gene Cagg_3471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3471
Symbol
ID	7269696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4229468
End bp	4231570
Gene Length	2103 bp
Protein Length	700 aa
Translation table	11
GC content	54%
IMG OID	643568279
Product	Polyphosphate kinase
Protein accession	YP_002464747
Protein GI	219850314
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0855] Polyphosphate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.448785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTAC CTGAATCACC AATACTCGAT ACGCCACCGC TCGCCGAGTC GCGTTACTTT 
AATCGCGAAT TGAGCCTGAT CGAGTTTAAT CGTCGCGTAC TCGAAGAGGC GATGGATCCG 
CGAAACCCGT TGCTCGAACG GGTGAAGTTT CTTGCGATCT TTGCCTCTAA TCTCGACGAA 
TTTTTCATGA TCCGGGTGAG CGGTATCAAA CAACAAATCC GAGCCGGTGT GCAAAAACGT 
TCACCTGACG GTCAGACACC GAGTGAACAG TTAAGTGCTA TCCGCCGTGC CCTGCTTCCA 
TTGCTCGATC AAGAGCGCGA TTTGCTCCTC AACGAGCTAC TCCCTGCTCT TCGCGAGCAG 
GGGATTAGTA TTCTCAATAC AGTCGCCCTT AACGCAGCAC AACGAGCATG GGTCGCCGAT 
TATTTTCGTC GTCAGATCTT TCCGGTACTT ACACCACTTG CGTTCGATTC GAGCCGACCG 
TTTCCCTTCA TCTCAAACCT GAGTCTCAAC CTCGCCGTAG TCATTCGCGA TCAGGCGAAG 
GGGGAACTTT TTGCCCGCAT TAAAGTTCCC GAAGTCTTGC CGCGCCTGAT TCCACTCCCG 
CAAGAACTTT GCCCGCCGGT CGGTGAATTG CCGCCGAGCC GTTGCCACTG CTTCGTCTGG 
ATCGAACAGG TGATCGCCGA TCATCTCGAA CAGCTCTTCC CCGGCATGAA TGTGGTTGAG 
GTTTACCCCT TCCGTGTAAC ACGCAATGCC GATGTGGAGA TCGAAGAGGA TGAAGCCGAC 
GATTTGCTGG CTACCATCGA ACAAGGATTG CGTCAACGCC GGTTTGGCGA GGTGGTGCGC 
CTCGCTATCG ATAGCGGCAT GCCTGAACGG ATCTGCCAAC TGTTAGCCGC CAATCTGAAA 
GTTAGCTCCG ATGACATCTA TACCGTGCGT GGCCCGCTCG GCCTCAGCGA TCTGATGCAA 
CTAACCAATC TTGATCGGCC TGATCTGAAA GACCCGCCCT ACGTGCCGCG TGTACCGGCT 
ATCCTTAAGA ATAGTGGGAC GATCTTCGAG GCGATTAAGA AAAATGATAT CTTATTACAC 
CACCCATACC ACTCGTTTAG CCCGGTGATC GATTTTATTC AAGCCGCCGC CGAAGATCCG 
AATGTGTTGG CAATTAAGCA GACGCTCTAC CGTGTCGGGC GTAACTCGCC AATCGTACAG 
GCATTGATGC ATGCCCGCGA GCACGGCAAA CAGGTGACGG TGGTCGTCGA GTTAAAAGCT 
CGGTTCGATG AAGAAAACAA TATTACGTGG GCCCGCGCAA TGGAACGAGC CGGTGTCCAC 
GTGGTGTATG GCCTGGTCGG TCTGAAGGTG CATGCCAAAC TCGCACTGGT CGTTCGGCAA 
GAGAGTGACG GTATTCAGTG TTATGTCCAC CTTGGTACCG GTAACTACAA CGCGGTGACT 
GCACGTGTCT ATACCGATCT CGGATTACTG ACATGCCGAC CCGAGATTGC TGCCGATGTG 
GTCGATCTGT TCAATTATCT CACCGCGTAC AGCCGGCAAA AAGAGTATCG CAGCTTACTG 
GTTGCACCGG TTAATCTGCG TCACCGCATG ATCGAGTTGA TCGAGGAAGA GATCGCACTT 
CACCGCTTGT ACGGTAATGG GCGACTCATC TTCAAAATGA ACGCATTGGT CGACCGCAAG 
ATGATTGATG CGCTCTACGC TGCCTCACAA GCCGGGGTAC AGATCGATCT GATCGTGCGA 
GGGATGTGTT CATTGCGCCC ACAAGTTCCC GGCCTCTCCG ACAATATTCG GGTGCGCTCG 
ATTGTCGGTC GCTATCTCGA ACATAGCCGG ATCTACTACT TCTCCCACGG TGGTAAGCCT 
AAAGTGTATA TCGGGAGCGC CGATATGATG GAACGAAACC TCGACCGGCG CGTTGAAGAA 
CTCTTCCCCC TCTCCGACCC AATCGCAATC CAATACGTCA CCGAGCGGCT ACTTCCTACC 
TATCTGGCCG ATAACTTACG CGCCCGTGAA CTCCAACCTG ATGGTCGTTA TGTGCGCGTC 
CATCCCGACG GTCACGAGGT TATCGACAGC CAAGACCCTG CCCGCATTAT TCCCGGCTGT 
TAA

Protein sequence

MTVPESPILD TPPLAESRYF NRELSLIEFN RRVLEEAMDP RNPLLERVKF LAIFASNLDE 
FFMIRVSGIK QQIRAGVQKR SPDGQTPSEQ LSAIRRALLP LLDQERDLLL NELLPALREQ 
GISILNTVAL NAAQRAWVAD YFRRQIFPVL TPLAFDSSRP FPFISNLSLN LAVVIRDQAK 
GELFARIKVP EVLPRLIPLP QELCPPVGEL PPSRCHCFVW IEQVIADHLE QLFPGMNVVE 
VYPFRVTRNA DVEIEEDEAD DLLATIEQGL RQRRFGEVVR LAIDSGMPER ICQLLAANLK 
VSSDDIYTVR GPLGLSDLMQ LTNLDRPDLK DPPYVPRVPA ILKNSGTIFE AIKKNDILLH 
HPYHSFSPVI DFIQAAAEDP NVLAIKQTLY RVGRNSPIVQ ALMHAREHGK QVTVVVELKA 
RFDEENNITW ARAMERAGVH VVYGLVGLKV HAKLALVVRQ ESDGIQCYVH LGTGNYNAVT 
ARVYTDLGLL TCRPEIAADV VDLFNYLTAY SRQKEYRSLL VAPVNLRHRM IELIEEEIAL 
HRLYGNGRLI FKMNALVDRK MIDALYAASQ AGVQIDLIVR GMCSLRPQVP GLSDNIRVRS 
IVGRYLEHSR IYYFSHGGKP KVYIGSADMM ERNLDRRVEE LFPLSDPIAI QYVTERLLPT 
YLADNLRARE LQPDGRYVRV HPDGHEVIDS QDPARIIPGC