Gene Cagg_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2026
Symbol
ID	7269185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2486508
End bp	2487914
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	54%
IMG OID	643566861
Product	hypothetical protein
Protein accession	YP_002463350
Protein GI	219848917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCCGA TTTGGGAAGG TATCTTCATC CATTCGGCCA TGTACGTGGC GATTGTTTCG 
GCATTCCACG TACTTGCCTC ACACCTGACC GTCGCTGCGG CATGGTTCAA CCTCTATCTC 
GAACGACGGG CGGTTTATGA AAAGCGTCCT GAACTGTACG AGTACTTACG CCGGAGCGCA 
TTAGGCTTGC TCGTCTTTGC GTATGTCTTC GGCGCGATGG CCGGCGTCGG TATCTGGCAA 
ACCACTACCG CAGCGAACCC ACGCGGTATT TCGACGCTTA TCCACAATTT CGTCTTCTAC 
TGGGGAGCTG AATGGTACAT GTTTTTGATT GATGTCGTTG GTATTATCGC CTACTACTAT 
TCGTTCGGTC GGATTGATCC GAAAACACAC CTACGGTTGG CATGGATTCT CGCCCTTGGC 
GGTACCGGCA CATTATCTAT CATCGTAGGA GTTTTATCAT TTAAGCTCAC CCCCGGTCTG 
TGGTTAGATA CCGGTGTGAG TCTGAACGGT TTCTTCAATC CCACCTTCTG GCCACAAATC 
TTCCTGCGCT TTGCGCTTAT GTTCCCGATT ACCGCAGCGT GGGCGCTGCT CATTGTGACT 
GGCATGCCCA AAACATACCC CGAGCGCGAA CCGATTATCC GCAATGCGGC CCTGATGGGT 
TTGGGCGGCT TGGCGGTCGC GCTGGCTATT TTCGTCTTCT GGTTCTACCC AGTGCTGCCC 
GAGCACGCCA AAATTATTAT GCGAACCCGC GCCATACCGC CGATTACCTA TACCGTTATT 
CTTGGCGGAA TCGCCGCGAC GTTTGCCGGT CTGCTGTTTG CGTGGCGGTT TCCCCAGCGC 
CAGCAACGCC TGATTGCGTT GGGTGCGCTG TTCGTGTTGT TTGCCGCGAT CTTTGGCGCC 
GAACGCACCC GCGAAGTCTT ACGCAAACCC GATATTATCG CCGGCTATAT GTCATCGAAT 
CAGCTCGTTT TCAACGATCT GCCAGCCCGT AGTATCCAGA GTGAAGAGCA GCGGCTCAAT 
GAGACCGGTA TGCTGGGGTC GTTGCCATTT CTCCCTCGGC CTGACCAGAT CGTGCTGCCG 
GCCAATAGTG GATTGCCCAA TCAGACAATT GCCGTCGGAC GCACCTTAGT CATGCAGCAG 
TGCGCCTCGT GCCACAATGT GAGCCAGCAA ACGGCATTGA TTGGGTTCAA CCAACGCTTG 
GCGTTACGGT CACTGGCCGA TCTGTTATAC CTCCGTCGAG CCACGACGGC TGATCTGATC 
AAGTCGCGCA TCCGCGCAAT TGGCGGGTTC CAGTATATGC ATCCGGTGGT CGGCACTGAA 
GAAGAACTTT CCGCTATGGC TCAATATCTC GAATACTTTG TCCAGCAGGT GCATCCGTCG 
CAACCCCAAG TAGTCACGCA GAGGTGA

Protein sequence

MYPIWEGIFI HSAMYVAIVS AFHVLASHLT VAAAWFNLYL ERRAVYEKRP ELYEYLRRSA 
LGLLVFAYVF GAMAGVGIWQ TTTAANPRGI STLIHNFVFY WGAEWYMFLI DVVGIIAYYY 
SFGRIDPKTH LRLAWILALG GTGTLSIIVG VLSFKLTPGL WLDTGVSLNG FFNPTFWPQI 
FLRFALMFPI TAAWALLIVT GMPKTYPERE PIIRNAALMG LGGLAVALAI FVFWFYPVLP 
EHAKIIMRTR AIPPITYTVI LGGIAATFAG LLFAWRFPQR QQRLIALGAL FVLFAAIFGA 
ERTREVLRKP DIIAGYMSSN QLVFNDLPAR SIQSEEQRLN ETGMLGSLPF LPRPDQIVLP 
ANSGLPNQTI AVGRTLVMQQ CASCHNVSQQ TALIGFNQRL ALRSLADLLY LRRATTADLI 
KSRIRAIGGF QYMHPVVGTE EELSAMAQYL EYFVQQVHPS QPQVVTQR