Gene NATL1_01161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01161
Symbol
ID	4780269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	112838
End bp	113962
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	35%
IMG OID	640083379
Product	RNA methylase family protein
Protein accession	YP_001013945
Protein GI	124024829
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG TTGCATCTAT TTCACAAGGT CTTGAAAAAG AGGGTGCAAA AGAGTTGATA 
GAACTTGGAG CTAAATCAGT TAAAGCTTCA AGGAGGCATA TATCCTTTGA AGCTGATATG 
GCTTGTTTAT ACAGAATACA TTTAAGAGCT CGCTTATCCT TTCGATTTTT AAGAGAGATT 
GTCAAATTCA CTTGTCATGG TCCTAATCAA CTTTATGACG GTGTTCAAAG GTTAATTGAT 
TGGGAAAATT GGCTTCAGCC AAGACAAAGT TTTCGAGTAG ATGTAACTGG ATTTGGAGAA 
GGGTTATCAC ATACTCATTT CACTGCTTTG CAGGTTAAAA ATGCAATTAT TGATTTACAA 
AGAGAACGAT GGGGTTCTCG TTCAAGCATT GATTTGAACA ATCCAGATAT TTGTTTTCAT 
TTGCATTTGT CAAATTATCA AGCTGTTTTG AGTGTTGATG GTAGTAACTC GAGTCTTCAT 
AAAAGAGGGT ACAGACCAGC TGTTGGCATG GCTCCGATTA AGGAAACCTT GGCCGCAGGT 
TTAATGAGAA TGACTGAGTG GGATGGAACG AAAAATTTGG TAGATCCATT ATGCGGTTCC 
GGAACCTTTT TGATTGAAGG TGTGAGCATG TTACTTGGCA TTGCATCTGG TATGGATAGA 
CAATTTCTGT TTAAGAATTG GCCAGATTTT GATATCTCTT TTTGGAATAA AGAATTACAA 
ATGGCAAAGA AGATAAAACC TTTAAATAAG AAGTTATCTA AAATAATTGG ATGTGAAGTT 
GATGAAATGA TTGCTCACTC TGCTAGTGAG AACGTTAGGA AAGCGGGCTT AAAAGATTAC 
ATAGAAATAA TTAACTGTCC TTTTCAAGAA TTTCAACTAC CTCCTGGTTT AGGATTTTTA 
ATTTGTAATC CTCCTTATGG GAAAAGAATA GGAGATGAAA ATGAACTACC TAATCTATAC 
AAACAATTAG GTGAATACTG CAAGACACAA GCTTCTGGAT GGGATCTTTG GTTACTTAAT 
GGGAATCCAA AGCTAAGCAA ATATTTAGGG ATGAAAGCAA GTCGACGTTT TCAAGTAAAT 
AATGGTTCAA TTGATTGCCG ATGGTTGAAT TATAAAATTA AATAA

Protein sequence

MKIVASISQG LEKEGAKELI ELGAKSVKAS RRHISFEADM ACLYRIHLRA RLSFRFLREI 
VKFTCHGPNQ LYDGVQRLID WENWLQPRQS FRVDVTGFGE GLSHTHFTAL QVKNAIIDLQ 
RERWGSRSSI DLNNPDICFH LHLSNYQAVL SVDGSNSSLH KRGYRPAVGM APIKETLAAG 
LMRMTEWDGT KNLVDPLCGS GTFLIEGVSM LLGIASGMDR QFLFKNWPDF DISFWNKELQ 
MAKKIKPLNK KLSKIIGCEV DEMIAHSASE NVRKAGLKDY IEIINCPFQE FQLPPGLGFL 
ICNPPYGKRI GDENELPNLY KQLGEYCKTQ ASGWDLWLLN GNPKLSKYLG MKASRRFQVN 
NGSIDCRWLN YKIK