Gene Msed_1754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1754
Symbol
ID	5104754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1689980
End bp	1691575
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	49%
IMG OID	640507649
Product	DNA topoisomerase VI subunit B
Protein accession	YP_001191833
Protein GI	146304517
COG category	[L] Replication, recombination and repair
COG ID	[COG1389] DNA topoisomerase VI, subunit B
TIGRFAM ID	[TIGR01052] DNA topoisomerase VI, B subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.259807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.193391
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGCTA AAGAGAAATT TACTAGCATC TCGCCGGCGG AGTTCTTCAA GAGGAACCCA 
GAGCTAGCAG GTTTCTCCAA TCCGGCTAGG GCTATGTATC AAGCTCTAAG GGAATTGGTT 
GAGAACGCGC TGGATGCAAC AGATGTCCAC GAGATTCTTC CGTCCATCAA GGTAATCATT 
GAGAGAACCA GCCAGGAAAA AGAGATTTAC AGGCTCACTG TGGAGGACAA CGGAATAGGT 
ATCCCACCGC ACGTAGTTCC TGACGCATTT GGAAGGGTGC TCTACAGCTC AAAATATGTA 
CTGAGACAGA CCAGGGGAAT GTATGGGCTT GGTGTCAAGG CAGCCGTCCT CTACAGCCAG 
ATGTATCAGG ACAAGCCTAT TGAAATAACC ACTGCCCCGC TCAACTCCAA GAGGATCTAC 
AGCTTCAAGT TAAAGATAGA CGTAACAAAG AACGAGCCCA TCATCTACGA GAGAGGCTCA 
GTGAATAACG ACACTGGCTA TCATGGTACT TCAGTCTCCA TGTACATTCT AGGGGACTGG 
ATGAGGGCCA AGAGCAGGGT GTACGAGTAT ATAAAGAGGA CCTACATCAT CACCCCCTAC 
GCCGAGTTTT ACTTTAAGGA TCCGGAGGGA AACGTGGTCC TATATCCTAG GCTCACCAAC 
AAGATGCCAG TCCCTCCCAA GGAAGTGAAG CCCCATCCCT ATGGCGTTGA TATAGAGTTA 
CTCAAGAACA TGATCTCGAG ACAGAAGGAG GACACAACGG TAAAGGAGTT CCTGGTGAAG 
GAGTTTCAGA GTGTGGGAGA GAAAACAGCC CTTAGCGTAA TTGAAATGGC CGGATTGGAT 
CCTGATAAGA GGGTCCAGAA GCTCACCGAT GACCAGCTTT CTAAGCTGGT AGATGCTATG 
AAGAACTTCC CTGACTTTAG ACCCCCTTCA CCCGAGGCCC TTTCCACAAT CGGGGCCGAC 
TTAATAGAAC TCGGCCTGAA GCAGACCTTC AACCCAGAGT ACGTCGGTGC AGTTACCAGG 
AGACCTAAGG CCTATCAAGG CCACCCCTTC ATCGTGGAGG TTGGGCTTGC CTATGGTGGG 
GATATTCAGC CCTCCGAGGA GCCCACGGTC CTGAGATACG CCAACAAGAT ACCCCTCATA 
TACGACGAGA AATCTGACGT TGTATGGAAA GTTGTCGAGG AAATTGACTG GAAAAGGTAT 
GGAATAGAGG ATGAACAGCT ACCCCTAGTG GTTATGGTTC ACCTCTGCAG TACCAAGGTG 
CCGTACAAGA GCGCAGGTAA GGAGAGTATA GCTGATGTAG AGGAAATAGA GAAGGAGATA 
AGGAACGGAA TAATGGAGGC TTCAAGGTCG CTTAAGACCT TTATGACAGA GAAGAGGAAG 
GAGGAGGAGG CTAGGAAGAG GCTTCTAACC TACCTCAAGT ACATCCCAGA GCTTGCCAGG 
TCGCTCTCCA TCTTCGTGAC GGATGGGAAA AAGGAGCTAG CTCCCAAGGT TCAGGAGGAA 
ATACAAAACA AGATGATAGA CCTAGTGGTG ACTAAGCTTA ATATTAAAGA CAAAGATTTG 
GAATTATTTA AGTCATATAG GGTTGAGACA CTATGA

Protein sequence

MSAKEKFTSI SPAEFFKRNP ELAGFSNPAR AMYQALRELV ENALDATDVH EILPSIKVII 
ERTSQEKEIY RLTVEDNGIG IPPHVVPDAF GRVLYSSKYV LRQTRGMYGL GVKAAVLYSQ 
MYQDKPIEIT TAPLNSKRIY SFKLKIDVTK NEPIIYERGS VNNDTGYHGT SVSMYILGDW 
MRAKSRVYEY IKRTYIITPY AEFYFKDPEG NVVLYPRLTN KMPVPPKEVK PHPYGVDIEL 
LKNMISRQKE DTTVKEFLVK EFQSVGEKTA LSVIEMAGLD PDKRVQKLTD DQLSKLVDAM 
KNFPDFRPPS PEALSTIGAD LIELGLKQTF NPEYVGAVTR RPKAYQGHPF IVEVGLAYGG 
DIQPSEEPTV LRYANKIPLI YDEKSDVVWK VVEEIDWKRY GIEDEQLPLV VMVHLCSTKV 
PYKSAGKESI ADVEEIEKEI RNGIMEASRS LKTFMTEKRK EEEARKRLLT YLKYIPELAR 
SLSIFVTDGK KELAPKVQEE IQNKMIDLVV TKLNIKDKDL ELFKSYRVET L