Gene Nmag_4235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_4235
Symbol
ID	8826863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013925
Strand	+
Start bp	9708
End bp	11087
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	63%
IMG OID
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_003482305
Protein GI	289594298
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACCTGC TCGAGCTGTG GGCGGTGGTC GACATGATCT CCGAATGGAC CGGCGACATC 
CACGAGGGTG ACGCCGAGGA GGTTCTTGCA GAACTCCCCG AGTCCTCGGT CCACTGCGTC 
GTCACATCTC CCCCGTACTT CGGGCATCGC GATTACGGAG TCGACGGCCA GATCGGCCTC 
GAGGACAGCC TCGACGAGTT CATCGAATCA CTCGTCGACG TCGCGAGCGA GATCCGGCGA 
GTCCTGCGGG ACGATGGGTC TTGGTGGCTC AACCTCGGAG ATTCCTTCGC TGGATCCGGC 
GGCGCAGGTG GTCAGTGGGG CCAGAACGAA CACGGCTCGG CGACTCGTCT CGCGGACGCT 
GGTGATGCGT ACAACGGCCC GCTGAACACG AGCAACATCC GACGAAAGTC GAAGATGCTC 
GTCCCTCACC GGGTGGCGAT TGCTCTCGAA AACGCCGGCT GGATCATCCG CGCCGACGCC 
GTCTGGACGA AGCCCAACGG GATGCCGAGT TCCGCACACG ACCGTCTGAA CGAAAAGAAG 
GAGTTCGTGT TCCACCTGGT TCCCGAGCCG CACTACTGGT TCAACCTCGA CGCCATCCGC 
GAACCCCACT CTGAGGCGTC GCTGGAGCGG GCTGGTCGGC ACGACCAGGC GAAACGAGGC 
TACCCGAGTA ACGACCACTC GCTCGAGCCA TCGCGGTTCT GCCACCCGAA CGGCAAGAAC 
CCGGGCGACA TCTTCGAGAT CAACGCCGCG CAGTTCTCGG ACGCTCACTT CGCAGTTTTC 
CCCGAGGAGC TGTGTAAGGA CCCCATCAAG TCATCGTGTC CTGAGAAGGT TTGCGCTGAG 
TGTGGAACGC CGCACGAGCA ACTGACCGAG GAGATCGACC CGTGGAACGT CGAGAGCCCC 
GATCGCGAGC AGCTTCGCCG GGCGATCGAG GTGTACAAAG CGTCCGATCT CACGGAAGAT 
CACCTCGAGG CAGTTCGTGC GTACGGGTTC GCCGACGCTG CGGCGGGGAA GAACCAGAAC 
CGCTCTGGCC TGAATGACGA GCGCGTTCAG CAGCTCGCCA GCGAGGCGAA GGACGTCCTC 
GAGGGGTACT TCCGCGAGTT CACGACGACG TACGAGCGCC ACATCGGGTG GGAAGCCGCC 
TGCGATTGTG AGACCGACGA GACGAACCCG GGAATCGTCC TGGACCCGTT CGCGGGCGCC 
GGCACAACCT GCCTTGTAGC AAAACGATTC GGCCGACGGT TCATCGGCGT AGACCTAAAT 
CCGGAGTTCG TTGCGATGGC CCAGCAGCGG ATCGGCCTCG ACGTCGACGA CCCTGATCTC 
CTCCTCGACG AGGACGAAAC GAGCCTGAGA GAGTTCATCG AGGTCGGTGA TACCCCGTGA

Protein sequence

MDLLELWAVV DMISEWTGDI HEGDAEEVLA ELPESSVHCV VTSPPYFGHR DYGVDGQIGL 
EDSLDEFIES LVDVASEIRR VLRDDGSWWL NLGDSFAGSG GAGGQWGQNE HGSATRLADA 
GDAYNGPLNT SNIRRKSKML VPHRVAIALE NAGWIIRADA VWTKPNGMPS SAHDRLNEKK 
EFVFHLVPEP HYWFNLDAIR EPHSEASLER AGRHDQAKRG YPSNDHSLEP SRFCHPNGKN 
PGDIFEINAA QFSDAHFAVF PEELCKDPIK SSCPEKVCAE CGTPHEQLTE EIDPWNVESP 
DREQLRRAIE VYKASDLTED HLEAVRAYGF ADAAAGKNQN RSGLNDERVQ QLASEAKDVL 
EGYFREFTTT YERHIGWEAA CDCETDETNP GIVLDPFAGA GTTCLVAKRF GRRFIGVDLN 
PEFVAMAQQR IGLDVDDPDL LLDEDETSLR EFIEVGDTP