Gene Msed_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1867
Symbol
ID	5104135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1811079
End bp	1812704
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	52%
IMG OID	640507753
Product	DEAD_2 domain-containing protein
Protein accession	YP_001191931
Protein GI	146304615
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG1199] Rad3-related DNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.512598
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGCTAA GGGACTGGCA ATTAGCGCTC AAGGACAAGG TAGTGAAGGG GCTAAGGGAA 
GGCAATCTAG TAGCCCTGCA GTCCCCCACT GGAAGTGGAA AGACTCTTTT CTCTCTCGTT 
TCCGCGTTTG AAGTTAGGCC TAGGGTTCTT TTCACTGTTA GAACCCACAA CGAGTTCTAC 
CCTGTTTACA GGGAAGTTAA CAGGCTCGGG AAGAGGTTCT CCTTCGTCAT GGGGAAGGGA 
AGGGCCTGCC TCTACGCCGA TGAAGGCGCA GATCCTGAGG ACATAAAGTG CTCCCTGTGT 
GACTCCTACG TTGCGATGTT CGTGGATTCC ACGGAGCCTC CCTTTACCCT TCTCAAGGAA 
CTCAAGGAGA GAGGGAGAAG GGAGAAGTTT TGCCCCTATT TCTCCCTGAT TAACTCAACC 
AGCGTCGCCG ACGTGATTGC CGTGACCTAT CCCTACGTGT TCACGCCTTG GATGTGGGAG 
GCCCTTGGTC TGGAACTAGA CGACTTCGTC CTCGTGGTGG ATGAGGCCCA CAACCTGGAT 
AACTTGAACG AGCTAGCAGA GAGGAAGCTC AGCCAGCAAA TCCTCGACCT CGCCCTCAAG 
GAGGTTAAGA GCAAGGAGGC AATCTCGATC CTTGAGAGAA TCAAGAGGGA ACTAGGTGAG 
GTGGTCCTCC AAGAGGAGAG ATACATCAAG GTAGAGGATT ATCCTAAGGT GGACGGACAC 
GAACTCAAGC TCCTGAAGGA GGAATACGAG GACAGAAGGA ACGAGATGAT TGCCAACAGA 
TCCATAAGGA AACTCCACTT GGGATCGGTG ATCAAGTTCT ACAGCTCAGA TGAGGCCCCA 
GTCTTCTCCT ACCGTGGTCA CCTGGTGATG AAGCCCCTCC TCTCCTCACC ATTTCTGTCG 
ATCCTAAATC GCGACGACCT ACCCGTGATA CTAATGTCAG GGACCATGCC ACCAAAGGAG 
TACCTGAGCA AGGTCCTGGG AATACAGAGG CAGATTCTTT ACCTAGACGT CGAGAAGGAG 
GTGAAGGCGA AGGTCACAGG GTCCTTTGAT TGTATGCTTG CAATTGACGT AACCTCGTCC 
TACTCCCTGA GGAGCCAGGA GATGTGGAAG AAATACGCCA GCTACCTCCT CAGGATATAT 
CACCTGGCCA AGGCCAACAT CCTCGCGATT TTCCCCAGTT ACTCCATCAT GGAGAAGGTC 
ATGGCCCACG TAAAGGTTGA CAAGTACGTC GAAGGTAGCA GGACAAACCT AGAGGAGGTG 
ATCGGTGAGT CCGGAAAGAG GAAGCTCATC ATTGCTGGAG TTGCCCGGGG TAAGCTCTCC 
GAGGGGATTG AGCTAACCAG GGACGGAGCC AGCGTCATAA GCGACGTCGT CCTCTGCGGT 
ATACCCTATC CCTCCTTTGA CGATTACCTG AAACTTAGGA GCGAGGCCAT ATACAAGTTA 
ACGGGACAAC CTGTTAGGGA GGCTCTCATG GAGATACCGG CACTCATAGC GGTGAAGCAG 
GCAATAGGGA GGGCAATCAG GAGCAGGCAG GACCATGCTA CCGTCTGGTT ACTAGATAGG 
AGGTTTGAAA CCTCGTGGTG GAAACTAAAG ATAAACTGTT TTAATCCCAA GAAGGTGAAA 
CTCTAG

Protein sequence

MELRDWQLAL KDKVVKGLRE GNLVALQSPT GSGKTLFSLV SAFEVRPRVL FTVRTHNEFY 
PVYREVNRLG KRFSFVMGKG RACLYADEGA DPEDIKCSLC DSYVAMFVDS TEPPFTLLKE 
LKERGRREKF CPYFSLINST SVADVIAVTY PYVFTPWMWE ALGLELDDFV LVVDEAHNLD 
NLNELAERKL SQQILDLALK EVKSKEAISI LERIKRELGE VVLQEERYIK VEDYPKVDGH 
ELKLLKEEYE DRRNEMIANR SIRKLHLGSV IKFYSSDEAP VFSYRGHLVM KPLLSSPFLS 
ILNRDDLPVI LMSGTMPPKE YLSKVLGIQR QILYLDVEKE VKAKVTGSFD CMLAIDVTSS 
YSLRSQEMWK KYASYLLRIY HLAKANILAI FPSYSIMEKV MAHVKVDKYV EGSRTNLEEV 
IGESGKRKLI IAGVARGKLS EGIELTRDGA SVISDVVLCG IPYPSFDDYL KLRSEAIYKL 
TGQPVREALM EIPALIAVKQ AIGRAIRSRQ DHATVWLLDR RFETSWWKLK INCFNPKKVK 
L