Gene NATL1_01521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01521
Symbol	anmK
ID	4779644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	149826
End bp	150962
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	36%
IMG OID	640083416
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_001013981
Protein GI	124024865
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.888233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTAT TGGGTTTGAT GAGTGGTACG AGTGCGGATG GAATAGATGC AGTTTTAGTT 
GATTTTACAG GTGATCCTTC AAAGCCAAAA TGGCAAATTC TAAACACATT TTCTTATGAA 
TATCCTTCAT CAATTAGAGA AAAAATAATA CAAGTAGGTC AAGGATTAAA AATTAGTAGC 
AAAGATTGGC TCGAGTTGGC TGAGGAAATT ACTGAACTAA ATGCTTTTGC TGCTCGTACT 
TGTGACCCTG ATTCAACCGC AGAGGTTGTT GGATGTCACG GCCAAACTTT ATTTCATAGA 
AGTGTAAAAA AATCTAAAAG AGGAGGAAGT CTTCAAATTC TTTTAGGACC TTTACTCGCA 
AATCTTTTAG ATCAAATTGT TATTTATGAT TTTAGATCTA AGGATATTGC TTCAGGTGGT 
CATGGTGCCC CTTTAGTAGC ATTAGTCGAT GAAGCTTTAG TTGGAAGGTT ATATGGATGG 
CGAGGAGTCC TCAACCTTGG TGGAATTGCT AATCTTACAA TTATTCCACC TAAAACTGGA 
ATTGATAAAA CTTCTCAATG CTTAGGCTGG GATTGCGGAC CGGCTAATTC TTTAGTTGAT 
TTAGCTGTTA AAGAAAGTAC AAATTCATCT TTAACTTTTG ATGAAAATGG ATCATTAGCA 
TCGCTTGGGA TTCCTAAATT AGAAATCATC GATAAGTGGT TGAGGGATCC TTTTTTTTAT 
CTAGAGCCTC CACGATCTAC AGGTAGAGAA CAATTCGGTT TTCAATACTT ACAGAAAAGA 
AAAAAGGAAT TGGGTGATAT TTCCAAAGAA GATTTAATAT CTACATTAAC TACATTTACC 
GCGTCAATTA TCTCTCAAGA TTTAGATAAT CTTTTTAAGT TCAAACAGAT ACGTTTAATT 
GAGCTTTTGG TTGCTGGAGG TGGAAGTAAA AATCTATTTT TAATGAGGCA ACTACAGAAA 
CAATGTTGTG GTGTTCATGT GCGTCCAATA AATGAAATTG GTGTTCCATC GCAATATAGA 
GAAGCACTCG TTTTTGCAAC TTTATCTTGG TGGAACTTTT TAGGAAAAAA AGTTAACCCG 
AAGTACATCA CAGGAGCAAA GAAACCTATT TTATATGGTG TACGTGTTGA TCCTTAA

Protein sequence

MRVLGLMSGT SADGIDAVLV DFTGDPSKPK WQILNTFSYE YPSSIREKII QVGQGLKISS 
KDWLELAEEI TELNAFAART CDPDSTAEVV GCHGQTLFHR SVKKSKRGGS LQILLGPLLA 
NLLDQIVIYD FRSKDIASGG HGAPLVALVD EALVGRLYGW RGVLNLGGIA NLTIIPPKTG 
IDKTSQCLGW DCGPANSLVD LAVKESTNSS LTFDENGSLA SLGIPKLEII DKWLRDPFFY 
LEPPRSTGRE QFGFQYLQKR KKELGDISKE DLISTLTTFT ASIISQDLDN LFKFKQIRLI 
ELLVAGGGSK NLFLMRQLQK QCCGVHVRPI NEIGVPSQYR EALVFATLSW WNFLGKKVNP 
KYITGAKKPI LYGVRVDP