Gene Tery_3298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3298
Symbol	anmK
ID	4243604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	5058586
End bp	5059836
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	37%
IMG OID	638108288
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_722879
Protein GI	113476818
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00913494
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCAAGG TTATTGGTTT GATAAGTGGT ACTTCCGTAG ATGGTATAGA TGCAGCTTTG 
GTTGATATTA CTGGAAGTCA AACAAATTTA ACAGTTGAAT TACTCACAGC ACTTACTTAT 
CCCTACCCAG ATAATTTGCG ATCGCAAATT CTTGATATTT GTTCCGGTGC ATCTATCTCA 
ATAGCTGAGT TAGCTGAACT TAATGATACT ATTGCTCAAG AATTTGCGAC GGCAGCATTA 
ATAATTAACC AGAAATATGC TGTGAATGCA GAACTAATTG GCTCTCACGG TCAAACTGTG 
TATCATCGTC CACCATCTCA ACAATTAGGC TATAGTCTAC AGTTAGGTCG TGGTGAGGTT 
ATTGCTAATT TAACTGGAAT TACTACCATT AGTAATTTTC GGGCTGCTGA TATTGCAGCC 
GGAGGTCACG GTGCCCCCTT AGTTCCTTGT GTTGATGTTC ATTTACTGGG TCACCCAAAA 
TATACTCGAT GTGTACAAAA TTTAGGTGGA ATTGGTAATG TGACTTATCT AAAAAATCAA 
CCCTTTTGGG GAAGTCAAAA TTCAATCCCC CCTTTACCTG TTTATATGGG GAAAGTCAAA 
AGTAAAAAAA AAGAGGAATT AGTAACAACC TTAGCTGATA CTCAAGGAGT TTTAGGTTGG 
GATACAGGAC CGAGTAATAC ATTATTAGAT TTAGCAGTAC AACAGCTTTC TCAAGGAAGT 
AAAACCTACG ACAAAAATGG AGAATGGGCA GCTACTGGCA GACCATGCCA AGAGTTAGTA 
GAAATATGGT TAAAACAAGA CTTTTTTCAA CAGAAACCCC CAAAGTCTAC GGGACGAGAA 
TTATTTGGTA AGGACTATTT ATTAAAATGT TTTAGTGATG GGGAAAAATA TCATTTAAGT 
GCTTCTGATA TATTAGCAAC TCTCACAGAA TTAACAGCAG CTTCAATTAA TCATAGCTAT 
AGAAATTTCT TACCAAATTT GCCAGACCAA ATATTATTAT GTGGCGGTGG TAGTCATAAT 
TTATATTTAA AAAAACGGAT AGAGAATTTA TTAGCACCAA TACCGGTAAT GACCACTGCT 
GAAGTAGGTA TAGATGTAGA TTTTAAAGAA GCGATCGCTT TTGCAATTTT AGCTTATTGG 
CGTTCCTTAG AAATTCCCTG TAATTTGCCA GAAGTTACAG GAGCAAAATC TCAAGTTATG 
TTAGGGGAAA TTCATCAACC AATTACAAGG AATAAGGGAA TAGCAGAATA G

Protein sequence

MTKVIGLISG TSVDGIDAAL VDITGSQTNL TVELLTALTY PYPDNLRSQI LDICSGASIS 
IAELAELNDT IAQEFATAAL IINQKYAVNA ELIGSHGQTV YHRPPSQQLG YSLQLGRGEV 
IANLTGITTI SNFRAADIAA GGHGAPLVPC VDVHLLGHPK YTRCVQNLGG IGNVTYLKNQ 
PFWGSQNSIP PLPVYMGKVK SKKKEELVTT LADTQGVLGW DTGPSNTLLD LAVQQLSQGS 
KTYDKNGEWA ATGRPCQELV EIWLKQDFFQ QKPPKSTGRE LFGKDYLLKC FSDGEKYHLS 
ASDILATLTE LTAASINHSY RNFLPNLPDQ ILLCGGGSHN LYLKKRIENL LAPIPVMTTA 
EVGIDVDFKE AIAFAILAYW RSLEIPCNLP EVTGAKSQVM LGEIHQPITR NKGIAE