Gene Msed_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2043
Symbol
ID	5105265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1965958
End bp	1968018
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	47%
IMG OID	640507933
Product	replicative DNA helicase Mcm
Protein accession	YP_001192107
Protein GI	146304791
COG category	[L] Replication, recombination and repair
COG ID	[COG1241] Predicted ATPase involved in replication control, Cdc46/Mcm family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGACTC AGCAGTTTGA TTTAGGTGAA AGGCTGGAGG AATTTATCAG AACCTCTAGG 
GATAGAGACG GGAACCTGAA ATACCTTCAA CAGATCAATG AGATACTGGC ATTTAGGAAA 
AGGAGCCTCG TAGTGGATTT CAATGAGATT TATCAATTTG ATGAGAAGTT GGCAACAGAA 
ATAATTAACA GTCCGCTATC AACTCTGCCC ATCCTGGAGG GCAGGATCCT CAAGTTATTG 
GAGGAGCAAG ACCCACAGTT CGTAACTGAG GTTCAGAGGG TTCATCTGAG ACTTGTAAAT 
GTTCCAAGAC TGGTGGAACT ACGCAGGATC AGAAGTTCTG AGATAAATAA GATAGTTGTG 
GTTGAAGGTA TACTTACCAA GCAGACCCCA ATTAAGGAGA GGGCCTACAG GATAGTCCTC 
AAGCATGTCC ATCCCGAGTG TAACGCAGAA TTCAGATGGC CAGAGGACGA GGAAATGGAC 
GAAACCATAA AGATGCCCTC TGTGTGTCCA GTATGCGGTA AACCTGGCCA ATTCGATATT 
ATTCCTCAGA AGGCTGAGTT GACCGACTGG CAGAGGGTCA TAATCCAAGA AAGGCCAGAG 
GAGGTTCCTC CAGGTCAGAT CCCTAGGCAA TTGGAGGCAG TATTTGAGGA TGACCTTGTG 
GACTCAGCGA GACCGGGGGA TAGGGTCAGG TTTACCGGGA TTCTAATGAT AAAGCAGGAT 
TCCTTCCTCC GCAAGGGGAG CAGGTCTATC TTCGACATCT ACCTGAAGGT AATTAACGTG 
GAGATATCCC AGAAGGTACT AGATGAGGTT GAGATAACGG AGGAGGATAG GAAAAAGATA 
GAGAATATGG CCAAAAATCC CTGGATAAGG GAAGCCATAA TATCCTCCAT CGCCCCCTCA 
ATTTACGATC ATTGGGAAAT CAAGGAGGCT ATAGCCCTAG CCTTGTTCGG TGGCGTATCA 
AGAGTTATGG AGGATGGAAC GAGGACAAGG GGGGACATAC ACGTGCTCAT TATAGGCGAT 
CCGGGCACCG CGAAGTCGCA GATTCTTCAG TTCGCAGCTA GGGTGTCCCC AAGATCTGTT 
TATACCACGG GTAAGGGAGC CACTGCAGCT GGTCTCACTG CGGCGGTGGT GAGGGAGAAA 
AACACTGGAG ACTACTATCT GGAGGCCGGT GCTCTGGTCC TAGCCGATGG AGGTATAGCG 
GTGATAGACG AGATAGACAA GATGAGAGAA GAGGATAGGG TAGCTATACA TGAGGCCATG 
GAACAACAGA CGGTCTCCAT CGCAAAGGCG GGAATATTAG CGAAGCTTAA TGCCAGAGCC 
ACTATCATAG CAGCTGGAAA CCCCAAGTTC GGAAGATATA TCCAGGAGAG GGCCGTTGCA 
GAAAACATAG AGCTTCCGCC CACTATCCTC TCCAGGTTTG ACCTCATCTT CATACTCGTG 
GATAAGCCCG GAACGGAGGA CCAGAACCTG GCAAACCACA TCCTGGACAT GCATGGTGGG 
AAGGAGATAA GGAACTTCAT TCCGGTGGAA GACCTAAAGA AGTACATAGC CTTTGCGAGG 
AAGTTCGTGA ACCCGAAGTT GAATGAGGAA GCGAAGCAAC TCCTAGCAGA CTTTTACGTG 
GAAATGAGAA GGAAAAGTAG CGAAAACCCT AGCTCACCAA TTCTCATTAC TCCAAGACAG 
TTAGAGGCAC TCATTAGGAT TACAGAGGCC TACGCGAGGA TGGCTTTACG CCAAGAGGCC 
ACAAGGGAGG ATGCAGAGAG GGCGATAAAT ATTATGAGAA TATTCCTTGA AAAGGTGGGG 
ATTGACGTTG AGTCTGGCTC GCTCGATATA GATACAATAA TGACTGGGAA ACCGAAGAGC 
GCTAGGGAGA AAATGGTCAA GATTATGGAG GTTATCGAAC AGTTATCCAA TGATAAGGGT 
TGCGCTAAAC TTAAGGATAT AATAAAAGAG TCTGAAAGAG AAGGCATAGA GAAAAGTAGC 
GCTGAAAAGA TAATATCAGA CATGAAGAAA AGCGGCCTAA TTTATGAGGC TGCGACTGAG 
TGCTTTAAGA AAGTTTCCTA A

Protein sequence

METQQFDLGE RLEEFIRTSR DRDGNLKYLQ QINEILAFRK RSLVVDFNEI YQFDEKLATE 
IINSPLSTLP ILEGRILKLL EEQDPQFVTE VQRVHLRLVN VPRLVELRRI RSSEINKIVV 
VEGILTKQTP IKERAYRIVL KHVHPECNAE FRWPEDEEMD ETIKMPSVCP VCGKPGQFDI 
IPQKAELTDW QRVIIQERPE EVPPGQIPRQ LEAVFEDDLV DSARPGDRVR FTGILMIKQD 
SFLRKGSRSI FDIYLKVINV EISQKVLDEV EITEEDRKKI ENMAKNPWIR EAIISSIAPS 
IYDHWEIKEA IALALFGGVS RVMEDGTRTR GDIHVLIIGD PGTAKSQILQ FAARVSPRSV 
YTTGKGATAA GLTAAVVREK NTGDYYLEAG ALVLADGGIA VIDEIDKMRE EDRVAIHEAM 
EQQTVSIAKA GILAKLNARA TIIAAGNPKF GRYIQERAVA ENIELPPTIL SRFDLIFILV 
DKPGTEDQNL ANHILDMHGG KEIRNFIPVE DLKKYIAFAR KFVNPKLNEE AKQLLADFYV 
EMRRKSSENP SSPILITPRQ LEALIRITEA YARMALRQEA TREDAERAIN IMRIFLEKVG 
IDVESGSLDI DTIMTGKPKS AREKMVKIME VIEQLSNDKG CAKLKDIIKE SEREGIEKSS 
AEKIISDMKK SGLIYEAATE CFKKVS