Gene Msed_0184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0184
Symbol
ID	5103928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	148170
End bp	149381
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	45%
IMG OID	640506089
Product	phosphomethylpyrimidine kinase
Protein accession	YP_001190285
Protein GI	146302969
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0351] Hydroxymethylpyrimidine/phosphomethylpyrimidine kinase
TIGRFAM ID	[TIGR00097] phosphomethylpyrimidine kinase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000000409945
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.070974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCAAA GACCCATTGC GATGACAATA GCAGGAAGTG ACTCAGGAGG AGGGGCTGGA 
GTTCAGGCAG ACCTCAAGAC CTTTACATCT CTTGGCGTGT TCGGCGTATC TGTCATAACT 
GGTTTGACTG CCCAGAATAC AGCTAGAGTC ACCAAGGTCC TGGAAGTCCC CCCAGAGTTT 
GTGGAGTCCC AATTCGATAC TATAATGGAG GACTTTCAGG TTAAGTATGC CAAGACAGGA 
ATGCTTGCAT CGAGCAGGAT AGTTGACGCT GTGGAGAGAA AGCTGACACA ATATGGAATT 
AACCTAGTCC TAGACCCAGT TATGATATCA AAGAGTGGTT ACCCTCTAGT AACCGAGGAA 
GTGGTAAGGG ATATAGTGAG GCTAGCTAGA AAATCCCTGA TAATAACCCC CAACAAATAT 
GAGGCGGAAA GACTAACTGG ATTTAGGATA AGAACTCGAG ATGATCTAAG AAATACAGCA 
TTGCACCTCT ATAAGAGCTT GGGTGTAAAC GTTGTGGTAA AGGGAGGGAA AGCCATTGGA 
GGATATGATT TCGCAGTCGT TGATGGCGAT GAGATTGAGC TACGTGGAGA ATTAATAAAT 
ACCGATAATC TTCACGGGAG TGGTGATGTA TTTTCCGCCT CAATTACGGC CTTTCTGAGC 
AAGGGTCTTA ATCTACGCGA CGCGTTAAGG GAGGCTAAGA AAGTTGTAAG TGAGGCAATC 
AAATTCTCTC TTGCAATTGG TCACGGGAAC GGGCCAGTGG ATCCTTTCTC CTCTGTGGAG 
AGGGTGGTTA AGATTAACCA AGCCAGGGAG GATCTCGAGA GACTTGTGGA ATTTCTTGAA 
AGGAACAAGG AAATCGTTAA GAAAATGATA ACTCATGAGG AAAAAATGAA CATTGGTGTC 
CTAACAGAGT ATGGGGATTT CGCAACTTTA GCCGGGGGGA TCATAAGGTA CATTGACTGG 
ATTAAGGTAG ATGGTCCCAT TGTGGTGAAC TGGTACTACA ATATAGTACA CAAGGCCTTG 
AAACAAACTG GCAAGAGGCT TGGTATTTTG GTGTCCTTGA CAAACGAGAT ATTAAATGCT 
TGTGAGGGCG GTAAACTGAA AATTTCTGAA AGTGGAATTT ACGGCGATCT GGTAATGATA 
GATGGGAGGG CAGTCTTGGT GGGAAACAGT TTAAGTGAGA TTATGGAGAA ACTGGAGGTC 
CTGAGGAATT GA

Protein sequence

MMQRPIAMTI AGSDSGGGAG VQADLKTFTS LGVFGVSVIT GLTAQNTARV TKVLEVPPEF 
VESQFDTIME DFQVKYAKTG MLASSRIVDA VERKLTQYGI NLVLDPVMIS KSGYPLVTEE 
VVRDIVRLAR KSLIITPNKY EAERLTGFRI RTRDDLRNTA LHLYKSLGVN VVVKGGKAIG 
GYDFAVVDGD EIELRGELIN TDNLHGSGDV FSASITAFLS KGLNLRDALR EAKKVVSEAI 
KFSLAIGHGN GPVDPFSSVE RVVKINQARE DLERLVEFLE RNKEIVKKMI THEEKMNIGV 
LTEYGDFATL AGGIIRYIDW IKVDGPIVVN WYYNIVHKAL KQTGKRLGIL VSLTNEILNA 
CEGGKLKISE SGIYGDLVMI DGRAVLVGNS LSEIMEKLEV LRN