Gene Cagg_2025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2025
Symbol
ID	7269184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2485305
End bp	2486504
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	55%
IMG OID	643566860
Product	hypothetical protein
Protein accession	YP_002463349
Protein GI	219848916
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTCG GTGAGATGCT CAAAATGATG CGCGACCCGC TCGGCGCGCC GTTTTATCCG 
CCAGCGTTGC AGGTGTTATT GGTCGTAACG TGGGTGTTGC ATATCTTCTT TGTTACGCTC 
GCCTTGGGAT CAAGTTTGTA CGCGATTTGG GGCTTTCTCC GTCCTACCGA CTACCGATTA 
CGGCTGGCAC GGGTCGCTGC CCGGCTCACC CCAAATGCGG TTGGGCTAGG GATTGTTACC 
GGCATTGCAC CTCTGCTGTT TGTGCAGACG ATCTACGATC CAATTTGGTA TGCCAGCAAC 
TCTTTGACCG GGTTTTGGTC GGTCAGTTTC ATCTTTGTGG TCATGGGCGG CTACAGTCTC 
GCATACCTGT TCTACCTGAA GGGCAGCCCT GACGGGAAAT TGCTTTGGTC GGCGGTGGCA 
TCGTTCATCT TACTCTTCTT CGCCGGCTGG ATTATGCATG TGCTGGCGGC AGTCTCGATC 
CGACCTGAAC GCTGGATGGA GTGGTATGCG CCGAATGGCA TTATTGATAC ACGCGGAATC 
ATCTTCCATG CGTGGAACAT TCCGCGGCTT GTGTTTTTGT TGCCCTTGCA AGCCTGCCTG 
AGCCTTGCGG TGACGCTGAC TTTGTTCGGT TGGTATTTCC GTCGGAGTGA GGAAGATGCA 
CCTTTTATAC AATGGGTGGC CAACCTTGGT CGGAAACTAG GCCTTGTGAT TAGCCCGATC 
TACGCGCTTG CCGGCTTGCT CTGGGCGATG ACCGAAGGTG TTGAGTTCGG TATCGGTTGG 
CAAGTCGGGA TCACGTTAGT GGGCATCGGA GTAGCACTGA CCGGCTATTT CTTCTGGCTG 
CGCCAACCAA TCCGCCATGC GCCGCGCACG TTGCTCGTTT GGATAGGAAC GCTGGTTGTG 
GTAGGTATGG TACGCGAAGC GATCCGGGTT GTCTCACTAG CACGATTCGG GTACAGTGTC 
GCTACCTACC CCTATGCCTT CGATTGGGGA TCGATTATCG TATTTACCGT AACCACCATC 
GTCGGCGTCG CAGTACTCGC GTATCTCATA ATGGTGATGT ACCAGTCTGG TGGGGTGAAG 
CGTGATGCGC AGATCTCTCC CCGTGTGGAG CGGCTTGGTA CGATTGCTAC CGGTATGTTA 
GGGGCGTGGT TTGGCTTCTT CCTGCTCGTT GGCTTGTATG CCACCTTCTT GCTAAGGTGA

Protein sequence

MNVGEMLKMM RDPLGAPFYP PALQVLLVVT WVLHIFFVTL ALGSSLYAIW GFLRPTDYRL 
RLARVAARLT PNAVGLGIVT GIAPLLFVQT IYDPIWYASN SLTGFWSVSF IFVVMGGYSL 
AYLFYLKGSP DGKLLWSAVA SFILLFFAGW IMHVLAAVSI RPERWMEWYA PNGIIDTRGI 
IFHAWNIPRL VFLLPLQACL SLAVTLTLFG WYFRRSEEDA PFIQWVANLG RKLGLVISPI 
YALAGLLWAM TEGVEFGIGW QVGITLVGIG VALTGYFFWL RQPIRHAPRT LLVWIGTLVV 
VGMVREAIRV VSLARFGYSV ATYPYAFDWG SIIVFTVTTI VGVAVLAYLI MVMYQSGGVK 
RDAQISPRVE RLGTIATGML GAWFGFFLLV GLYATFLLR