Gene P9211_00591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00591
Symbol
ID	5731700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	65307
End bp	66431
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	37%
IMG OID	641284401
Product	RNA methylase family protein
Protein accession	YP_001549944
Protein GI	159902600
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.950833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTG TAGCGATAAT TTCTCCAGGC CTTGAAGCTG AGGCAGCAAA AGAATTGTAT 
GAATTGGGTG CAGCAGAAAT TCAACCTTTA CCACGATGCG TAGAATTTCA AGTTGATTTG 
CAATGTTTTT ATAGGATCCA TTTGAGAAGT AGATTACCCT TTCGCTTCTT AAGAGAAATA 
GCCCGATTTC ATTGTAATAA TCCAGAATCT TTATATACAA ATGCACAGCA AGCTTTTGAT 
TGGATTAGAT GGCTTCCTCC ATCCAAAACG TTTAAGGTTG ATGTCTCAGG AACTAGTTTT 
GGCTTAACGC ATAGTCATTT CACAGCCTTA CAAGTAAAAA ATGCCATTAT TGATTTACAA 
CGAAGTTCTT GTGGAAAAAG ATCCGATATA AGCGTTCAGG ATCCAGACAT ATGTATTCAT 
TTACATTTGC ACAACAATCA GGCTGTTTTG AGTCTTGATT CATCCGCTCA TAGCTTGCAT 
AGAAGAGGTT TTCGTCCAGC GATGGGAGTT GCACCTTTAA AAGAAAACCT TGCTGCTGGC 
TTATTGCGTC TGACTAATTG GGACTTTTCT ATGCCCTTAG TAGATCCATT GTGTGGCTCT 
GGGACTTTCT TAATCGAGGG AGCTGCACTA GCGCTTGGCT TAGCTCCAGG CTTACATCAA 
AAGTTTCTTT TTACAAATTG GCCCGATTTT GATACTTCTT TATGGGAGCA GGAAAAGCAT 
TTAGCTCAAG TTAGTCAATT ACCTAAGCAA CAGTTACCAA AAATTATCGG ATGTGAGAAA 
AATAGTGAAA TAGCTAATCA GGCAAAAAGT AATATAATTG AGTCAGGTTT AGGCTTAGAA 
ATAAAGATTC AGAATAGTCA TTTTTTTGAT CTTGAATTGC CTAATGATAA AGGACTGATT 
GTTTGTAATC CCCCTTATGG AAAAAGATCT GGAAAAGAAG AAGATTTGGA AACTTTATAT 
AATGAACTTG GCTCTTTTTG TAAAAAGAAA GCTTCTGGAT GGAATCTATG GCTACTTAAT 
GGTAATCCAA ACTTAAGTAA GTTTCTTAGA TTAAAAGCTA AAAGGCGTAT ACCAGTCAGT 
AACGGAGGTA TAGATTGTCG ATGGCTGCAT TATGAGATTA ATTGA

Protein sequence

MKLVAIISPG LEAEAAKELY ELGAAEIQPL PRCVEFQVDL QCFYRIHLRS RLPFRFLREI 
ARFHCNNPES LYTNAQQAFD WIRWLPPSKT FKVDVSGTSF GLTHSHFTAL QVKNAIIDLQ 
RSSCGKRSDI SVQDPDICIH LHLHNNQAVL SLDSSAHSLH RRGFRPAMGV APLKENLAAG 
LLRLTNWDFS MPLVDPLCGS GTFLIEGAAL ALGLAPGLHQ KFLFTNWPDF DTSLWEQEKH 
LAQVSQLPKQ QLPKIIGCEK NSEIANQAKS NIIESGLGLE IKIQNSHFFD LELPNDKGLI 
VCNPPYGKRS GKEEDLETLY NELGSFCKKK ASGWNLWLLN GNPNLSKFLR LKAKRRIPVS 
NGGIDCRWLH YEIN