Gene Cagg_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2007
Symbol
ID	7269165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2453052
End bp	2454722
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	60%
IMG OID	643566841
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_002463331
Protein GI	219848898
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAAGA TGCTGCAAGG TGCCGGTGGT GCTGCTGGGT TGGCGTTGGG TCCTGCGTAC 
CGCTGGCAGC GTGTGGCTAC GGTAGCAGTT GATCCGCCTC ACGAGTCGGT AGAAGCGGCA 
TTGGCTCGCT TTCATGCAGC ACAACGTGCC GCCGCAGCAC GCTTGCGTGC TATCGCCGAA 
CGGCAACGAG CAGCCGGTTT GCACGAAGCC GATTTGTTCG ATGCACAAGC TTTGCTGGTC 
GAAGATGAGA CCTTGACCGA TGGGGTGACG GCGCTGGTGC TTGATGGGCA GCCGTTGACG 
ACGGCAATTC GCACAACAGT GGCGCAAATG CAGGCGTTGC TCGCCGATCT TGATGATGAG 
TATCTGCGGG AACGTGCGGC TGATATGGCC GCGGTTGGGG TGGAGTTGTT GCATGCGCTG 
GCCGGCGAGA CCGCATCGCA GCCAACTGTC CCGCCCGACG CTATTGTCGT TGCTGATGAT 
TTGACGCCCG CCGAAACGGT CGACCTACCG CACCACGTTG CCGGTTTTGC TACTGCCGAT 
GGTGGTCCGA CCGGTCATAC TGTTATTCTT GCCCGCGCAC GAGGTGTGCC GGCAGTAGTA 
GGGGTAGGTG ACGAAATCCT CGCTGTGCCC GATGGCGTAC AGCTTTTGAT CGATGGCGAT 
GCCGCGACGG TATTGATCGA CCCCGATGAA GCAGCGTTGC AGTCGGCTCA AGTGCGGATG 
GAGGCGTTGC GAGTGCTGCA ACGGCGACAA GCGGCGTTGC GGGATCAGCC CGGTCAGTTG 
CGTGATGGCC GCTTAGTTGG ATTGTGGGCC AACATTGGTC GTCCGGCTGA GGCGCGATTG 
GCCCGTGAGT ACGGGGCCGA AGGTATCGGA TTATTTCGGA CGGAGTTTCT TTTTCTCGAC 
CGTTCGGCGC CACCAGATGA AGATGAGCAG TATACGGCAT ATTGCGCGGT GTTGGATGAG 
TTGCCCGGCA AGCCGGTAGT GATCCGCACA CTCGATATCG GTGGTGATAA GCCGTTGCCG 
TATCTCCCAC TTTCCCCTGA AGCGAACCCG TTTCTTGGGG TGCGAGGGTT GCGGCTCTCG 
ATGCAGCGCC CCGATCTCTT CCAAATCCAA TTGCGTGCGT TGTTACGGGC AGCGTTTCGT 
GGCGATATTT GGATTATGCT ACCGATGGTT GCCACTCCAG CCGATCTCGC GTGGGCGCGT 
GCGCAGTTGG TGGAAGCGGC GGCAGCCTTG GCAGCGGCCG GTGTTGATCA TCGGCCCGAT 
CCACCACTGG GTGTGATGAT CGAGACGCCG GCGGCGGCGG TGTTAGCCGA TCAACTGGCA 
CGAGACGCGG CCTTCTTTAG CATTGGGAGC AACGATTTGG CTCAGTATAC ACTGGCGGTT 
GATCGTGGTC ATCCTACCCT GGCGGCTCGT TATCCCTCCA ATGATTCGTC GGTCTGGCGG 
ATGATCGATC TGGCTGCGCG TGCTGCACAG CAGGCCGGTA TTCCGATTGG TATTTGTGGT 
GAGCTTGGTG GTGAACCAGA TGCCGCTCCA GCTCTGGTGG GCTTAGGCTT GCACGAGTTG 
AGTATGGCCC CGGCTCGTAT TCCGGCAGTC AAGGAACGAC TGCTGCAAAC CTCATGGGCT 
GAAGCACAAG CGGCTGCGGC GCGGGCGCTT GCGGGGTGGC GAGAAGCATA A

Protein sequence

MGKMLQGAGG AAGLALGPAY RWQRVATVAV DPPHESVEAA LARFHAAQRA AAARLRAIAE 
RQRAAGLHEA DLFDAQALLV EDETLTDGVT ALVLDGQPLT TAIRTTVAQM QALLADLDDE 
YLRERAADMA AVGVELLHAL AGETASQPTV PPDAIVVADD LTPAETVDLP HHVAGFATAD 
GGPTGHTVIL ARARGVPAVV GVGDEILAVP DGVQLLIDGD AATVLIDPDE AALQSAQVRM 
EALRVLQRRQ AALRDQPGQL RDGRLVGLWA NIGRPAEARL AREYGAEGIG LFRTEFLFLD 
RSAPPDEDEQ YTAYCAVLDE LPGKPVVIRT LDIGGDKPLP YLPLSPEANP FLGVRGLRLS 
MQRPDLFQIQ LRALLRAAFR GDIWIMLPMV ATPADLAWAR AQLVEAAAAL AAAGVDHRPD 
PPLGVMIETP AAAVLADQLA RDAAFFSIGS NDLAQYTLAV DRGHPTLAAR YPSNDSSVWR 
MIDLAARAAQ QAGIPIGICG ELGGEPDAAP ALVGLGLHEL SMAPARIPAV KERLLQTSWA 
EAQAAAARAL AGWREA