Gene NATL1_18821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_18821
Symbol
ID	4780092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1539004
End bp	1540083
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	38%
IMG OID	640085171
Product	ribosomal RNA large subunit methyltransferase N
Protein accession	YP_001015702
Protein GI	124026587
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAAAAC TTCCTAAACT ATCAAGTAAT TCATCCTTGC TTGGCTTAAG TTCGGAAGAT 
CTTGAAGAAT TTGCTCGTCA GGAAGGTGAA AAGTCTTTTC GTGGTAGGCA AATTCATGAA 
TGGATTTATC AAAGAGGGGC AAAAAGCTTA GATTCAATAA GTGTTCTTCC AAAAAAATGG 
CGAGATTCAT TAGTACGTAA GGGAATTCAG ATTGGAAGGC TGGACGAAAT TAATAGAGTT 
GTAGCCGAAG ATGAGACATT GAAATTATTA ATGGGGACTT TTGATGGTGA GATTGTAGAA 
ACAGTAGGAA TACCAACAGA TAAAAGACTT ACTGTTTGTG TCTCAAGTCA AATTGGCTGC 
CCAATGGGTT GCAAATTTTG TGCGACTGGG AAGGGGGGGC TTAATAGATC TCTTGATGTG 
AATGAGATAG TTGATCAAGT TATTAGTGTT AGAGAAACAA TGAATAGGAG GCCTACTCAT 
GTCGTGTTTA TGGGTATGGG CGAGCCACTC CTAAATATTC AGAATGTTCT TGACTCTATA 
GAATGTCTCA CAAGTGATAT TGGTATTGGT CAAAGGAAGA TAACGGTTAG TACTGTTGGG 
ATACCGAATA CTCTTTCAGA TTTAGCAAAA TTAGCTCAAG ACCGTTTAGG AAGAGTTCAA 
TTCACACTTG CAGTCAGTCT TCATGCACCT AATCAGACGT TGCGTGAATT GATAATCCCC 
TCGGCGAGTT CATATCCAAT TAATTCATTA CTGAAAGACT GTAAAAAATA TATAGATCTC 
ACTGGTAGAC GAGTAAGCTT TGAGTATATA CTTCTTGGCG GTTTGAATGA CAAAGATATT 
CATGCAGAGC AGTTAGCTAA TCTGATGAGA GGCTTTCAGA GCCATGTTAA TTTGATAGCT 
TATAATCCAA TCGCTGAAGA GAACTTTAAG CGACCAAGCC AATCTAGAGT TAATGCCTTT 
AGAGAGCTAT TAGAAAATAG GGGAGTTGCT GTAAGTGTTC GTGCAAGTAG AGGTAGAGAT 
AAAGATGCGG CATGTGGACA ATTAAGAAGG CAAACAATCG ATAAAATAAA AATCAACTAA

Protein sequence

MTKLPKLSSN SSLLGLSSED LEEFARQEGE KSFRGRQIHE WIYQRGAKSL DSISVLPKKW 
RDSLVRKGIQ IGRLDEINRV VAEDETLKLL MGTFDGEIVE TVGIPTDKRL TVCVSSQIGC 
PMGCKFCATG KGGLNRSLDV NEIVDQVISV RETMNRRPTH VVFMGMGEPL LNIQNVLDSI 
ECLTSDIGIG QRKITVSTVG IPNTLSDLAK LAQDRLGRVQ FTLAVSLHAP NQTLRELIIP 
SASSYPINSL LKDCKKYIDL TGRRVSFEYI LLGGLNDKDI HAEQLANLMR GFQSHVNLIA 
YNPIAEENFK RPSQSRVNAF RELLENRGVA VSVRASRGRD KDAACGQLRR QTIDKIKIN