Gene Cagg_1026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1026
Symbol
ID	7268398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1272372
End bp	1273511
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	59%
IMG OID	643565872
Product	putative RNA methylase
Protein accession	YP_002462377
Protein GI	219847944
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTACC TCCTCCAAAC CTTACCCGGC CTCGCCGCGC TCACATGGCG TGAAGTTGAA 
CAAAAAATCC ATACCGACGA ACGGACTGCG CCACGCCAGG TTGGGGTGCG TAACGTACCG 
GGCCGCAACG ATCTTATCCT CCTTGATTAC CAAGGCTCAC CGCGCCGATT ACTGGAACTG 
CGTACCATCG AAGATGTCTT CGTTGTCGCG ACACGTGGCT TCAAAATCGC ACCTGACGAG 
CGCGGATTAC GCCAGATTCA TGCCGCAACC CGTAATGAGG AAGTCGTCAA ACCGGCACTC 
ACGTTGTGGC AACGGCTCAA TGGAGGCAAA CGGAACGGCA GCTTTCGCGT CGTTGCGCGG 
ATGGTCGGCA AACACCGCTT CCAGCGCTAC GAGCTAGGGC GGGCTGTCAG TGACGCGATC 
CGCGATGGCT GGCCAGGCCG TTGGCAGCCG GTAAACGAAG AAGCCGATTT AGAGGTGTGG 
GCCACCCTGA TCGAACAAGA ACTGATCGTC GCGATCCGGC TTTCCGATGC GTCGTTGCGT 
ATTCGTGGCA AAATTGCCCA CTTACCGGCC TCACTGCGTC CGGCCCTTGC CGCGACAATG 
GTGATGCTGA CCCAGCCGGC GGCTGATGAC ATTTTTCTCG ACCCAATGGC CGGCGTCGGT 
ACGATCTTGC TAGAACGGGC TGCCGCCGGA CCATTTACCG CGCTCTACGG CGGTGATATT 
AGCCCGGCTG CGGTGACGGC CATGCAAGCC AATCTCCGTG GTATCCACGG TCAGATCACA 
GTACGCCGCT GGAACGCGAC CAAACTACCG TTGCCCGACG CCAGCGTGAC CAAGGTTGCC 
GTTAATTTGC CGTTCGGCAC CCAGATCGGC GAAGGTGAAG ACCTCGAAGA GCTATACCAC 
GACGTGTTGC GCCAGATCGC GCGTGTGCTC AAACCGGGTG GACGGCTGGT GACCCTCGTT 
GCCAATCAAC AACTGCTCGA CCGGGCCAGA ACACATGCAG CACCGGTCTT ACGTGCCACG 
GCTCGCCACC GTGTACTGGT ACTCGGTCAT CGGGCAACAA TCTGTGAACA TATTCGGGTT 
CCTGATACGG CAGCAGCACC ACCGCCACCC ATACCTGCCG AAGATGACGA TTGGGAGTAA

Protein sequence

MLYLLQTLPG LAALTWREVE QKIHTDERTA PRQVGVRNVP GRNDLILLDY QGSPRRLLEL 
RTIEDVFVVA TRGFKIAPDE RGLRQIHAAT RNEEVVKPAL TLWQRLNGGK RNGSFRVVAR 
MVGKHRFQRY ELGRAVSDAI RDGWPGRWQP VNEEADLEVW ATLIEQELIV AIRLSDASLR 
IRGKIAHLPA SLRPALAATM VMLTQPAADD IFLDPMAGVG TILLERAAAG PFTALYGGDI 
SPAAVTAMQA NLRGIHGQIT VRRWNATKLP LPDASVTKVA VNLPFGTQIG EGEDLEELYH 
DVLRQIARVL KPGGRLVTLV ANQQLLDRAR THAAPVLRAT ARHRVLVLGH RATICEHIRV 
PDTAAAPPPP IPAEDDDWE