Gene Cagg_3340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3340
Symbol
ID	7267080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4052982
End bp	4054025
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	49%
IMG OID	643568150
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_002464621
Protein GI	219850188
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000107199
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000355353
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGGTG TGATTGAGGA AATGGACTTC AAGATAGACC GATTGCCCAA GGGTTTGCAA 
GATACGTTCC GCGAGCTGTA TGTGAACGGG AACGGGAATG GGACTCTGCA TGACGTGCGT 
CCGAACGAAA TCTATGTGGG AGATGCTCGA GCGCTCTTAC CAAACATAGA GCCTAATAGT 
ATTGCGTTGA GTGTTTGGTC ACCACCCTAT TTTGTTGGTA AAGAATATGA GGCGCACTTG 
TCATTTGAAG ATTGGCAGGA TCTGTTACGA ACGGTCATCC ATCTTCATTT CCCGATCATC 
AAACCTGGAG GGTTTCTGGT GATCAACATC GCTGACATTC TGGTGTTCAA AGATCCTTCG 
ATGCCTCGTA TTCAAGCCGA AGCGGTGACC AGAAAGCGTT GTCCCGTGAC AAAAGCGGAT 
GTATTGAAAG CGATGGCCGA ACATCCAGAC TATAACCGTT ATCAGCTTGC GAAGCTGCTT 
GGATGCAGCG AACAAACGAT CGACCGTCGG CTGCACGGCA ACAACATCCG AGGTGGAAAG 
TATGAATCAC AAACTCGCGT CAAGATTGTT GGCGGTCTTG TGGAAGAGTG GGCGTTAAGT 
GCCGGGTTGT ATCCGTATGA CCGTCGCATT TGGGTGAAAG ATGCTGCTTG GGAAAACTCG 
CGGTGGGCGA GTCTCTCCTA CCGATCGGTC GATGAGTTTG AGTACCTGTA TTTCTTCTGG 
AAACCAGGAA TTACCAAATT TGATAGAAAA AGGCTTTCCG CCGACGAATG GAAGAATTGG 
GGTTCCAGGG GAGTGTGGTA TGTTCCCTCG GTGAGAGCGA ATGACGATCA TGAGGCCAAA 
TTTCCCATAG AGTTACCCAC CAGGGTCATT CGATTGCTGA CCGATCCTGG TGATATTGTG 
CTTGATTGTT TCATGGGAAG CGGGACAACA GCAGTAGCAG CCATACGCGA GAATCGTCAG 
TATATCGGGA TAGAGATTCT GGAAAAATAT GTAAACTTGG CACGCCAACG AATTGCAGCG 
GAACATTTCA GTACGGGGAA ATAA

Protein sequence

MSGVIEEMDF KIDRLPKGLQ DTFRELYVNG NGNGTLHDVR PNEIYVGDAR ALLPNIEPNS 
IALSVWSPPY FVGKEYEAHL SFEDWQDLLR TVIHLHFPII KPGGFLVINI ADILVFKDPS 
MPRIQAEAVT RKRCPVTKAD VLKAMAEHPD YNRYQLAKLL GCSEQTIDRR LHGNNIRGGK 
YESQTRVKIV GGLVEEWALS AGLYPYDRRI WVKDAAWENS RWASLSYRSV DEFEYLYFFW 
KPGITKFDRK RLSADEWKNW GSRGVWYVPS VRANDDHEAK FPIELPTRVI RLLTDPGDIV 
LDCFMGSGTT AVAAIRENRQ YIGIEILEKY VNLARQRIAA EHFSTGK