Gene Msed_0135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0135
Symbol
ID	5104988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	110475
End bp	111779
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	38%
IMG OID	640506036
Product	nuclease
Protein accession	YP_001190236
Protein GI	146302920
COG category	[K] Transcription
COG ID	[COG1475] Predicted transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00112116
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTAAGT TCATTACAAT AACTAAGGTC AGTATTGATA AACTCAAAGA AGTACAAGAA 
TATAAGGAGT TAATACCAGA GAACAACAGC TATGAGGAGT TAAAGAACTC AATACAACAA 
TTAGGCTTCC TAGACCCAAT AACTGTCAAT ACAAATTATG AGATTTTAGA CGGTTATACG 
AGGTATAGGA TTGCAAAGGA GTTAGGAATT AAGGAAATTC CCGTTGAGGT TTATCAGACT 
TCTGGAAGGG AAGAAGAGCT GGACATTATT GCAAGCTTTA ATCTAAAAAG GAGGCATTTA 
ACAAAAAGCG AAATAATATT ACTTATTGAT AAAATATTAG AAAAGAAGAA GGAGTTAATG 
AAAAAAGTAG AGGAATTGGA AAAATCTAGT ACAAATGATA AAAATCTGGG GATGCATCCC 
CAACCTTCTG CTAGAGAAGA GGCTGATGAG ATACGAAAAG AATTAGAAGC GAAATTACCG 
CCAGATAATG TAATTGATAA CGATACCATC AGACGTTATG TTCAAATAAA GAAGGAAGCT 
CCATGGCTGA CCAACTATAT CGGTGATCCC AAAAACGGTA AGATTGGTAT AAGGACTGCT 
TATGATATCT ATCTAGCATT AAAAAGGAAG AACTTACTGG ACCTGGACAG AAGAATTCCA 
AAGAGTGAGC TGAAATTATT ACTCACTACC AGAGAAGGTC GCAAAATCAT CTCAGAAAGA 
GACGATCTAC TACAGCTGAT TTTAGACCAT AAGATGGCTG TTTCTCAAGC AATAAACAAA 
CTGAAGACCG AAGAGAAGTT AGCTAAGTCT AAGAAGTCCA GGGCAAAAGA GGAAGAGGAC 
TTAGACGAAA CTGAAGAAGA GGAGGGAGAG GAGGATGAAA GTAAAGGCAG ACAGAGAGAG 
TTAGATGAAA ATGATAACGA AGAATATGAC TTTGTGGGTG AATGGCAAAA AGCTAAGGAA 
GAGGAGGAAA AACAAGAGGC TAAACAACAG TTAACTCCCC AGTTAAACGG GCAACTCTTA 
GTAAAACAAG AGGTAACTGA AAGTAAAACC CAGAACGATT TCCTAAACGA CTTAAAGACT 
AAGGGGTTTG CAGAACTACC CTTTGAAATA GCACTAATTA AGATTGAAGG GAAATGTTAT 
GCAATAAACG TAGGAGCTCT GCGTGATTTA GAACAGGGAC TTCCAGAGAA GTGGAAGGGT 
CTTGAAGCCT TCCTAAATAA GTACAGCATT ATAATCCCGG ATGAGGTTGA AGGACTCTAC 
GTTATCCCGT GGAAACTGTT AGGAAGGTGT AACGAATGGA AATAA

Protein sequence

MAKFITITKV SIDKLKEVQE YKELIPENNS YEELKNSIQQ LGFLDPITVN TNYEILDGYT 
RYRIAKELGI KEIPVEVYQT SGREEELDII ASFNLKRRHL TKSEIILLID KILEKKKELM 
KKVEELEKSS TNDKNLGMHP QPSAREEADE IRKELEAKLP PDNVIDNDTI RRYVQIKKEA 
PWLTNYIGDP KNGKIGIRTA YDIYLALKRK NLLDLDRRIP KSELKLLLTT REGRKIISER 
DDLLQLILDH KMAVSQAINK LKTEEKLAKS KKSRAKEEED LDETEEEEGE EDESKGRQRE 
LDENDNEEYD FVGEWQKAKE EEEKQEAKQQ LTPQLNGQLL VKQEVTESKT QNDFLNDLKT 
KGFAELPFEI ALIKIEGKCY AINVGALRDL EQGLPEKWKG LEAFLNKYSI IIPDEVEGLY 
VIPWKLLGRC NEWK