Gene Msed_0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0402
Symbol
ID	5105519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	353191
End bp	354408
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	51%
IMG OID	640506308
Product	peptidase U62, modulator of DNA gyrase
Protein accession	YP_001190503
Protein GI	146303187
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCGT ACGCTGTACA GGAGATATCT AGTCAGACTC TAGTCATCAA GGTTGTGGAG 
AGCAAGATTG AGACCATTCA AAGGTTGAGG GACAAGTACT ACAACGTCCT CCTGAGAAAG 
GGGAACAGGT TCACCGTGAC CAAGGTCAGT TCCTTAGACA AGGTGAGCCT GGATAAGGCC 
CTGGATAAGC TTCCCGAGTC CAGAATAGTT CCCACGGTGT TGGAGAGGTC AGGTAAATAC 
TCCTTCTCCA AGGTTGATAA GGGGGTAGTG AACCTCTTTG AGGATTCCTC ACGCCTCCTA 
CCTCTCCTCA ACTCCAGGTA CCCCCTATAC GGCACTGTCA CGGCAACCGT AATTACCAAG 
AGGCTCACCA CAATTCACGG ATTTGAGGGG GAGGAGAGTA GAACCTGGTT CCAGGGATAT 
TTCAGGGCCA AGAATGGGGA TTATAGCGGA CAATGGGCGT TTGCCTCCTC CTTCTACGAC 
GAGAGAAAGG TGAAGGACAC GATCTCCAGG GCTGAGGAGT ATGCCTCCAT CACGGGAAAA 
TACGAAATCT CAGACGGAAA GTATGACGTT GTACTCTCCC CTCTGGTCAT GGGTAATCTC 
ATGGCTACTG TGGCCTACTC TGCCTCAGGT TACAGTATAA TGACAGGAAA CAGCTTTCTC 
TCAACCCACA AGCCAGGTGA TGTTGTGGCC AGCCAGAAAT TCACGTTGAT CGATAACCCC 
AAGGGAGACG AGTTAAATTC CTGGGAATTC GACGACGAGG CGGTGCCTAC TAGGAAGACA 
ACCATAGTGA ACAAGGGGGT CTACACGAGT CCCCTCCTCA ACATAGAGGT TGGGAAGATG 
CTTAATCAAG ACACCACAGG AAACGCAGGT TGGGTCTACC CAAGGCCGTG GACTCTGGAG 
GTCCTTCCTG GAGAGGTGTC AGAGAGCTCC CTGCTGGAGG GTAATGTGAT CCTCTTCAAC 
AATAACTGGT ACACCAGGTT CCAGAACAGA GCTGAGGGAC AGTTTTCGAC CGTTGGGAGG 
GATGCAGTTG TGGTAATAAG GGGAGGTAAA CCTGCAGGAG TGGCAGGAAG GGTGAGGATA 
GCTGACAAAC TGGGAAAAAT AATCTCCGGA ATAAGGGAGC TTTCCAAGGA AAGATATCCT 
GTAGCTTGGT GGGACGCACC CCTACCTGGG GTTTACCCAT TCGCCCTGGT CGAGGGAGTG 
AACTTAACCA GAGCTTAG

Protein sequence

MNAYAVQEIS SQTLVIKVVE SKIETIQRLR DKYYNVLLRK GNRFTVTKVS SLDKVSLDKA 
LDKLPESRIV PTVLERSGKY SFSKVDKGVV NLFEDSSRLL PLLNSRYPLY GTVTATVITK 
RLTTIHGFEG EESRTWFQGY FRAKNGDYSG QWAFASSFYD ERKVKDTISR AEEYASITGK 
YEISDGKYDV VLSPLVMGNL MATVAYSASG YSIMTGNSFL STHKPGDVVA SQKFTLIDNP 
KGDELNSWEF DDEAVPTRKT TIVNKGVYTS PLLNIEVGKM LNQDTTGNAG WVYPRPWTLE 
VLPGEVSESS LLEGNVILFN NNWYTRFQNR AEGQFSTVGR DAVVVIRGGK PAGVAGRVRI 
ADKLGKIISG IRELSKERYP VAWWDAPLPG VYPFALVEGV NLTRA