Gene Noc_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1201
Symbol
ID	3706700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1308567
End bp	1310066
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	58%
IMG OID	637737703
Product	N-6 DNA methylase
Protein accession	YP_343232
Protein GI	77164707
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.721125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCG CCTCCATCAT CTCCAAGGTC TGGAGCTTCT GCACTACCCT GCGCGACGAC 
GGCGTGGGTT ATGGGGATTA CCTGGAACAG CTCACCTACC TCATTTTCCT CAAGATGGCG 
GACGAATACA GCCAACCGCC CTATCGCCGC GAGGTGGGGA TTCCGCCGGA ATATAACTGG 
CAGAGCCTCA AGACCAAGCG GGGGGCGGAG CTGGAAGGAC ACTATATCGC GTTGCTGCGA 
GCGCTGGGCG CGCGGCCGGG GATGCTCGGG CAAATCTTTA CCAAGGCCCA GAACAAAATC 
CAGGACCCGG CCAAACTCTA CCGCCTCATC AAAATGGTGG ACGGCGTCCA ATGGGTCATG 
ATGGGGGCCG ACATCAAGGG CGATATCTAC GAAGGTTTGC TGGAGAAAAA CGCCGAGGAC 
ACCAAATCCG GGGCGGGCCA GTATTTTACC CCCCGCGCCT TGATTAAGGC CATCGTCGAG 
TGCGTGCGCC CCGAGCCGGA CAGGACCATC GCTGATCCAG CCTGTGGCAC CGGCGGGTTT 
TTCCTCGCCG CCTACGATTT CCTGAGCGAT CCCAAGCACT ATTCCCTGGA TAAGGCCCAG 
AAGCATTTTC TCAAGCACGA GACCTTCCAC GGCAACGAGA TCGTCGCCAA TACCCGGCGC 
TTGTGCCTGA TGAATATGTT CCTGCACCAC ATTGGGGAAA TCGACGGGGA GAGCGCCATC 
TCCCCTAATG ACGCCCTGGT GGCCCCCAGC GGCCAGAGCT ATGATTATGT GCTGGCCAAT 
CCGCCCTTCG GCAAAAAGAG CGCCATGAGC TTCACCAACG AGGAGGGAGA GCAGGAGAGC 
GACGATCTGA CCTACAACCG CCAGGACTTC TGGGCCACCA CTTCCAATAA GCAGCTCAAC 
TTCGTTCAGC ACATTCGCAC CCTGCTCAAG ACTACCGGCA AGGCGGCCGT GGTGGTGCCG 
GATAATGTGC TGTTCGAGGG CGGGGCCGGC GAAACGATCC GCCGCAAGCT ACTGGAAAAT 
ACCGATCTGC ATACCATCCT ACGGCTCCCC ACCGGTATCT TCTATGCCCA TGGGGTCAAG 
GCTAATGTGC TCTTTTTCGA TAACCGGGAG GCCAGTCCGC ACCCGTGGAC GAAGGAAGTG 
TGGTACTACG ACTATCGCAC CAATGTCCAC CACACCCTGA AAAAGAAGCC CATGCGCTAT 
GAGGACCTGG CCGAGTTCAT CGCCTGCTAT CATCCAACGA ACCGGCATGA ACGCCGGGAG 
AGCTGGCATG GGGAAAAAAA CCCGGAAGGC CGCTGGCGCA AATTCAATTA TGAGACGCTG 
GCCGCTCGGG ACAAGACTAG CCTGGATCTA TTCTGGCTCA AGGATAAAAG CCTGACGGAT 
CTCGACAATC TCCCCGAGCC CGAGGAATTG GCGGAAGAGA TCATCGAGAA CCTGGAAGCG 
GGCCTGAATA GCTTCCGGGA AGTGCTGGCG GGGCTGGCGG CAGGGGGAAA TCAAGAATAA

Protein sequence

MNTASIISKV WSFCTTLRDD GVGYGDYLEQ LTYLIFLKMA DEYSQPPYRR EVGIPPEYNW 
QSLKTKRGAE LEGHYIALLR ALGARPGMLG QIFTKAQNKI QDPAKLYRLI KMVDGVQWVM 
MGADIKGDIY EGLLEKNAED TKSGAGQYFT PRALIKAIVE CVRPEPDRTI ADPACGTGGF 
FLAAYDFLSD PKHYSLDKAQ KHFLKHETFH GNEIVANTRR LCLMNMFLHH IGEIDGESAI 
SPNDALVAPS GQSYDYVLAN PPFGKKSAMS FTNEEGEQES DDLTYNRQDF WATTSNKQLN 
FVQHIRTLLK TTGKAAVVVP DNVLFEGGAG ETIRRKLLEN TDLHTILRLP TGIFYAHGVK 
ANVLFFDNRE ASPHPWTKEV WYYDYRTNVH HTLKKKPMRY EDLAEFIACY HPTNRHERRE 
SWHGEKNPEG RWRKFNYETL AARDKTSLDL FWLKDKSLTD LDNLPEPEEL AEEIIENLEA 
GLNSFREVLA GLAAGGNQE