Gene Mbar_A3501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A3501
Symbol
ID	3624899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	4490945
End bp	4492291
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	49%
IMG OID	637702328
Product	hydroxymethylpyrimidine kinase
Protein accession	YP_306952
Protein GI	73670937
COG category	[H] Coenzyme transport and metabolism [S] Function unknown
COG ID	[COG0351] Hydroxymethylpyrimidine/phosphomethylpyrimidine kinase [COG1992] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00097] phosphomethylpyrimidine kinase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.604187
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA AAACCTTAAA AGTAAAAACC CCAATTGTTC TGACTATTGC AGGTTCGGAT 
TCAGGGGGAG GAGCCGGAAT TGCTGCGGAC CTGAAGACTT TTGCCGCTCT TGGAGTACAT 
GGAACCTGCG CTATTACATC GGTTACTGCA CAGAATACCA CTGGAGTGCT GAAAACCTTT 
GACCTCACTC CTGAAGCTGT CGCCAGCCAG ATTGAAGCTG TCTGCACCGA TATGGAGGTC 
GGGTGGGCAA AAAGTGGTAT GCTTGCCTCA TCGGAAATCG TAAGGGAAGT TGCAAAAGAA 
ATCAGGAAAT ACGAGCTTTC CCTTGTGCTG GATCCTGTTA TAGCTGCTGA AGCAGGAGGA 
AACCTGCTGC GAAAAGAAGC TATCTCTGTC CTTACCGAAG AACTGCTGCC CTTCTGCAAG 
GTTACGACGC CCAATGCATC CGAAGCAGGT GAGCTCGCTG GCATGGCTGT CAAAACCCCT 
GAGGACGCGA AAATCGCAGC CAGAAAAATT GCGGACCTGG GTGTCGAAGC TGTCATTGTT 
ACAGGAGGAC ACCTGAATGC CACTGACTTG ATTTATGAAG CTGATTCTGA GACTTTTACC 
CGTGTTCCGG GCACTTTTGT TAAAGGAGGA ACACACGGCA CGGGCTGCAC TTACTCTGCG 
GCAGTGACTG CCTTCTTAGC CTCAGGAGAG AACCTGGAAG GAGCTGCAAG GAAAGCAAAG 
AAATTCGTTG AACAAGCAAT CCTCAGGAGC AGGCCTGCAG GCAGGGGAGT AAGTCCTGTA 
AACCAGCTTG GAGTGGTTCT GGAGCAAAAA GAGCGCTATC TGGTATTAAG AGAATTAAAA 
GAAGCAGTTT CGATTCTTGA AGGCAGCCCT GATTTTTCAA AACTGATTCC CGAAGTAGGT 
TGTAACATAG GAATGGCTAT TCTTGAAGCT GACAGCTACG AAGACGTTGC GGCCGTCGAA 
GGCAGGATAG TAAGGCACAG GGGACGTGCG GTTCCTGTAG GTTGTGTGGA TTTTGGGGCC 
AGCCGACATG TAGCAAGGAT TATTCTCGCG TCCCTTCGTT ATGATCCTGA AGTTAGGGCA 
GCAATTAACG TAAAATACTC CAGGGAGGCA CTTGCAGCCT GCATAGATAT GAAACTTGAA 
ATTTCCTCTT TTGACAGGGC TGAAGAACCA GAAAACTCCA GTACTATGGA CTGGGGTACA 
GTCGAAGCAA TCAAAAAGTA CGGAAGTGTG CCGAAAATCA TCTGTGATAA AGGAGGCCAG 
GGAAAAGAAC CAATGATCCG CCTGCTCGGG AGATGTGCAA CTGAAGTGGC AAAGCTTGCT 
GTGGAGCTTG CAGAAAAAAT ACAGTAA

Protein sequence

MTEKTLKVKT PIVLTIAGSD SGGGAGIAAD LKTFAALGVH GTCAITSVTA QNTTGVLKTF 
DLTPEAVASQ IEAVCTDMEV GWAKSGMLAS SEIVREVAKE IRKYELSLVL DPVIAAEAGG 
NLLRKEAISV LTEELLPFCK VTTPNASEAG ELAGMAVKTP EDAKIAARKI ADLGVEAVIV 
TGGHLNATDL IYEADSETFT RVPGTFVKGG THGTGCTYSA AVTAFLASGE NLEGAARKAK 
KFVEQAILRS RPAGRGVSPV NQLGVVLEQK ERYLVLRELK EAVSILEGSP DFSKLIPEVG 
CNIGMAILEA DSYEDVAAVE GRIVRHRGRA VPVGCVDFGA SRHVARIILA SLRYDPEVRA 
AINVKYSREA LAACIDMKLE ISSFDRAEEP ENSSTMDWGT VEAIKKYGSV PKIICDKGGQ 
GKEPMIRLLG RCATEVAKLA VELAEKIQ