Gene Cagg_3343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3343
Symbol
ID	7267083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4055528
End bp	4056637
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	46%
IMG OID	643568152
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_002464623
Protein GI	219850190
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00148167
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000416126
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCACTAC CTTTAAATCA GGTTATTGAA GGCGATTGCG TGGAAATACT GAATACGTTA 
CCAGAAACAT CCATTGACCT TATTTTTGCC GATCCCCCCT ATCATTTACA ATTACAGAAC 
GAACTGTATC GACCAAATAT GACGAAAGTG GACGCTGTCG ATGACGACTG GGACAAGTTC 
GAGTCGATGC AAGCGTATGA TGAATTTACT CGAACGTGGT TAACGGCATG TAAGCGGGTC 
TTGAAACCAA CCGGCACCAT CTGGGTTATC GGAACGTACC ATAATATCTT TCGTGTTGGG 
GCCATAATGC AGGATTTAGG GTTCTGGATC CTCAATGATG TTATCTGGAT AAAACTCAAT 
CCGATGCCTA ACTTTCGTGG TGTCCGGTTT ACCAATGCCC ATGAAACCCT CATTTGGGCA 
AGTACCGGCA AAGATGCAAC ATATACGTTC AACTATTACG CGATGAAAGG GTTGAACGAT 
GAAAAGCAAA TGCGTTCTGA TTGGTGGCTT TTACCGTTAG CGACGGGATC GGAACGGGTA 
AAAAATGAAA ATGGCGATAA AGCCCATTCC ACGCAGAAGC CGGAGGCGTT ACTCTATCGG 
GTGATTCTAT CCTCCAGCAA TCCCGGTGAT GTTGTGCTTG ACCCATTTTT TGGAAGCGGA 
ACAACAGGTG TTGTCGCCAA ACGCTTGCAT AGAAATTGGA TTGGGATTGA AAAAGAGAAA 
AAATATATCC AGATTGCGCA AAAGCGCATT GACGCAGTGC AACCAGAAAT GTTTGACGCT 
GCGACGTTTG ACGTAAAGAG CAAAGCCAAA TCTGCTCCTA AAGTGGAGTT TTCGGTTCTG 
GTCGAACATG GGTATGTACA GCCTGGGCAA CGATTGTTTT TTGGAAAAGA CAAAACGAAA 
GTGGCCACAA TCAAGCCTGA TTCTCGGCTC CGTACTGCGG ACGGTTTCGA GGGCAGCATC 
CATCAGGCCG GTAGCCATTA CATGAACAAT GCGCCCTGTA ATGGATGGGA GCATTGGTTT 
ATCGAAGTTG ATGGTCAAAT GATCGGTCTT GGTGAAGTGA GAGAAAAGTT TCGGGTAGAC 
AAGGGGCTTT ACAATGAGCG ATCAGGTTAA

Protein sequence

MPLPLNQVIE GDCVEILNTL PETSIDLIFA DPPYHLQLQN ELYRPNMTKV DAVDDDWDKF 
ESMQAYDEFT RTWLTACKRV LKPTGTIWVI GTYHNIFRVG AIMQDLGFWI LNDVIWIKLN 
PMPNFRGVRF TNAHETLIWA STGKDATYTF NYYAMKGLND EKQMRSDWWL LPLATGSERV 
KNENGDKAHS TQKPEALLYR VILSSSNPGD VVLDPFFGSG TTGVVAKRLH RNWIGIEKEK 
KYIQIAQKRI DAVQPEMFDA ATFDVKSKAK SAPKVEFSVL VEHGYVQPGQ RLFFGKDKTK 
VATIKPDSRL RTADGFEGSI HQAGSHYMNN APCNGWEHWF IEVDGQMIGL GEVREKFRVD 
KGLYNERSG