Gene NATL1_09311 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_09311
Symbol
ID	4779223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	858043
End bp	859371
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	38%
IMG OID	640084208
Product	RNA methyltransferase TrmH, group 3
Protein accession	YP_001014754
Protein GI	124025638
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0566] rRNA methylases
TIGRFAM ID	[TIGR00186] rRNA methylase, putative, group 3

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0566162
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTATC GCTTCAATAA AGACACAAGG AATTCAAAAA ACTCTTCATC TAATAAACGA 
AGTAGTAATT ATTCTCGTCA AGATAATGAC TCCAAAAAGT CAAACTTTAA TGATAGAAGA 
AGAACCAATA ACAAAATAAA TCGTCATTCT TCTGATCAAG TAAATCAATA TTCATTAGGT 
AAAGAATTTT CTGATCGATC AAGAAGTAGT AACGAGGCTA ATTCCAACTA CAGAGGATCT 
AATCGATTCG AGAGGAAATC GACCAACTCT TCGTATAGAA ATCAAGACTC TCAGGAAACA 
AACAATTACA GAGGATCTAA TCGATTCGAG AGGAAATCGA CCAACTCTTC GTATAGAAAT 
CAAGACTCTC AGGAAACAAA CAATTACAGA GGATCTAATC GATTCGAGAG GAAATCGACC 
AACCCTGCGT ACAGAAATAA AAATTCTCAG AGAGCTAGCA GTTATAAAAG AGAAGAAAAT 
AATGAACCTC TTTCATATTC TGAAAGCTTT AGCAAAACAT TAAGTGATGA TCTGATTTGG 
GGCCGCCATT CAACTGAGGC AGCCCTTGTT GGCGGCAGGG CAATTCACAG GATTTGGTGT 
ACCTCCGAAT TACGCAGTAC ACCAAAGTTT TTTCAACTTC TCAAAGATCA AAAAGCTTCT 
GGGGTCTTAG TTGAAGAAGT TTCATGGTCA AGGCTTGGCC AGCTCACAAA TGGTGCAGTC 
CATCAAGGAA TAGTTTTACA AATTGCCGCA TCAAAAACAC TTGACTTGAA GAATTTAATA 
GATGCTTGCA AAGCTTTTGG TGATTCATCA TTGCTCTTAG CTTTAGATGG CTTAACTGAT 
CCTCAGAATC TTGGGGCAAT TATTCGATCT GCCGAAGCCC TCGGTGCTCA AGGATTAATC 
CTTCCACAAA GACGTAGTGC AGGATTAACA GGATCCGTAG CAAAAGTTGC CGCTGGAGCT 
CTGGAACATT TGCCTGTAGC AAGAGTTGTT AATTTAAATA GGTCTTTGGA GAAATTGAAA 
GATGAAGGTT ATACCGTTGT TGGCCTGGCG GAGGAGGGAT CATCTACTTT ATCTGAAATC 
AAATTTCAAG GTCCTTTAGT AGTAGTAGTT GGGTCTGAAG ATAAAGGAAT TTCTCTAATA 
ACTAGAAGAT TATGTGATCA GTTAGTAAGA ATTCCTCTTA AGGGAGTCAC TACAAGCCTA 
AATGCATCAG TTGCTACGTC TATTTTCTTA TATGAAGTTG CTAGATCCAA ATGGATGCGC 
TCAATCTCTG GACAAGACCC TTCTCCTAGA TTATTGAAAC CTCAGATTTC ATCTGAAAAG 
ATTAACTAA

Protein sequence

MSYRFNKDTR NSKNSSSNKR SSNYSRQDND SKKSNFNDRR RTNNKINRHS SDQVNQYSLG 
KEFSDRSRSS NEANSNYRGS NRFERKSTNS SYRNQDSQET NNYRGSNRFE RKSTNSSYRN 
QDSQETNNYR GSNRFERKST NPAYRNKNSQ RASSYKREEN NEPLSYSESF SKTLSDDLIW 
GRHSTEAALV GGRAIHRIWC TSELRSTPKF FQLLKDQKAS GVLVEEVSWS RLGQLTNGAV 
HQGIVLQIAA SKTLDLKNLI DACKAFGDSS LLLALDGLTD PQNLGAIIRS AEALGAQGLI 
LPQRRSAGLT GSVAKVAAGA LEHLPVARVV NLNRSLEKLK DEGYTVVGLA EEGSSTLSEI 
KFQGPLVVVV GSEDKGISLI TRRLCDQLVR IPLKGVTTSL NASVATSIFL YEVARSKWMR 
SISGQDPSPR LLKPQISSEK IN