Gene Msed_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0206
Symbol
ID	5104072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	169092
End bp	170189
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	46%
IMG OID	640506111
Product	tRNA pseudouridine synthase D, TruD
Protein accession	YP_001190307
Protein GI	146302991
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0784918
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0319695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAATGA GTTTACTGGA CTTAGCAATA GGAATAGAGT TTAAGGTGCA TAGATGGGCT 
TCAATTCGTG CAGAAATTCC AAGGCCTGAC GGCTTTCGGG TAACGGAGGA GATTGACGGA 
AAACCGTGTA CAGCCTGGAG AGGATCAGAG AGTGGCAAAT ATGCCGTTTA TCTCCTGAGA 
AAAAGAGGAA TGGAACATAA TGCGGTTATG TCCAGGCTGG CCTCTATTCT CGGTGAAAAA 
CCAAGGTACC TAGGAATAAA GGATACTAAT GCAGTTACGG AGCAACTAAT ATACGTAACG 
AGGAAGTCAA AGGATTTCCA CAGGGAGGAG TCCTTTTCCA TAGAGTTCAT GGGATTCACT 
TCGACAAAAC TGAACCACAC CGGTAACATT TTCTCCATAA AGCTTGAGAC AGGGGATAAG 
GAGGAGCTCA AAAGAAGGGT CAACACCATA AAGGGTGAAG GCGTTTTACC AGCCTTCATA 
GGGTATCAAA GGTTTGGAAC CAGAAGACCC ATAACGCATC TGGTAGGGAA GGCCTTAACT 
CAAAGGGACT GGTGCAAGGC GGTGGACTTC ATTCTAGGTT ATCCCTTCGT GTGGGAGAAC 
GAGAACATCA GGCTATTTAG AGAGGAATAC ATGAAAGGGG AGGTAAAAGA GGAACTTCTC 
AGGAAGATAC CGAGCCAGGA GAGAAACATT TACCTTGAGT TGAGGAAGAC CGAAGATTGC 
CTCTCTGCTC TCAGGAAATC GCGGGTTAAA CTTAGCTTTT ATGTGGAGGC TTATCAAAGT 
TACCTTTTCA ACAGGGTGCT ATCCAGGAAA CTAAGATATT CCACAGTGCA CGAGAGGGAT 
GAGATAACCA TTCCCACGGA TCCCAAACAA TGCGACGCAG AGTGCCTGGA AGTCTTCGAG 
GTTGAAGGGA TACAGAGGGG CAGTTTCCAC ATTGAGGAAC TGGGAATATC CCTTAGACCT 
GTGAAAAGAA ACGCTTTCAT GAATGTCAGA GGCCTGCATT TTGACGGCGA GTTCGTAACG 
TTTTCCTTGG AAAGAGGGAT GTATGCAACT GTGGTTCTAT CTGAGATCCT AAACGCCGAT 
CCAAAAGAGT TCACTTGA

Protein sequence

MRMSLLDLAI GIEFKVHRWA SIRAEIPRPD GFRVTEEIDG KPCTAWRGSE SGKYAVYLLR 
KRGMEHNAVM SRLASILGEK PRYLGIKDTN AVTEQLIYVT RKSKDFHREE SFSIEFMGFT 
STKLNHTGNI FSIKLETGDK EELKRRVNTI KGEGVLPAFI GYQRFGTRRP ITHLVGKALT 
QRDWCKAVDF ILGYPFVWEN ENIRLFREEY MKGEVKEELL RKIPSQERNI YLELRKTEDC 
LSALRKSRVK LSFYVEAYQS YLFNRVLSRK LRYSTVHERD EITIPTDPKQ CDAECLEVFE 
VEGIQRGSFH IEELGISLRP VKRNAFMNVR GLHFDGEFVT FSLERGMYAT VVLSEILNAD 
PKEFT