Gene Msed_1610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1610
Symbol
ID	5103974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1556523
End bp	1557587
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	45%
IMG OID	640507500
Product	peptidase M24
Protein accession	YP_001191689
Protein GI	146304373
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.75509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGGCTCA ACAAGCTTGA GAAAATAAAG GAAAAGTCTA ACGCGAAAAA CCTGCTAATT 
GTCGGGGAGC CTAACCTGTT CTATTTCACG GGATATAGGG GAGTTGGTGG CTTACTGGAC 
TGTGATGGTA CAAGGACCCT ACTGGTGCCA TTACTGGAAA GGAATAGGGC CTTGGGAATC 
AAGGACTTGG ATGTGAAGGT ATATTACCCG GTAAAGCTCG AGGAGAACGT AATAGAGGGA 
ACGCTAGTTT CAGCAGTAGA AAAACTCTGT CCTTCCACGA CAGATAAAAA GCTCTTGATA 
GATTTGGGTT ACGCCTCTGT GGATCTATTC CTTCAGTTGA GTTCTAAGTA TGAAGCGAAG 
AACATCACAG AAGATATACT CCAGACGAGG GCAATAAAGG AGGAAAAGGA AATTGAGGCT 
ATCAGGCATG CTCAGAGGGC AACCGCCATG GCCATGAAGA TGGCAAGCGA GTCTCTAGTA 
GAGGGAATAT CCGAAATTGA ACTTGCAGGC ATAATTGACG AGACCATGAG AAAGGGTGGT 
GCTGAGGACT ATGCTTTTCC CTCTATAGTC GCCTTTGGTG AAAATTCGGC TGAACCTCAC 
CATATTCCAT GCGAAAGAAG GCTGAGAAAG GGTGATACAG TAGTGGTAGA TATAGGGGCT 
AAATACAATG GATATTCCTT TGACAGCACA AGGACATTCC TGTACGGAAT CACAGAGAAA 
AGCAAGAGGA TATATGACGT GGTTCTTGAG GCACAACTAG AGGCAATCGA CGCAGTCCAG 
GAAGGAATAG AGGCGTCTCA AATCGATAGG ATAGCCAGAT CCAGGATTGA GAAGGAGGGT 
TTCGGAAAAC TATTCGTTCA CTCCACGGGA CATGGGGTGG GAATCGAGGT CCATGAAAGC 
CCAGCAATTT CCATGAAGTC TAAAGACATC CTAAGGGAAG GTATGGTAAT AACGGTAGAA 
CCAGGTATAT ACTTCCAAGG TGAACTGGGC GTTAGAATAG AAGATACAAT CCTTGTCAGA 
AAGGGTAAAC CGGAGGTCCT TGAGACCCTT TATAAGACCT TGTAA

Protein sequence

MRLNKLEKIK EKSNAKNLLI VGEPNLFYFT GYRGVGGLLD CDGTRTLLVP LLERNRALGI 
KDLDVKVYYP VKLEENVIEG TLVSAVEKLC PSTTDKKLLI DLGYASVDLF LQLSSKYEAK 
NITEDILQTR AIKEEKEIEA IRHAQRATAM AMKMASESLV EGISEIELAG IIDETMRKGG 
AEDYAFPSIV AFGENSAEPH HIPCERRLRK GDTVVVDIGA KYNGYSFDST RTFLYGITEK 
SKRIYDVVLE AQLEAIDAVQ EGIEASQIDR IARSRIEKEG FGKLFVHSTG HGVGIEVHES 
PAISMKSKDI LREGMVITVE PGIYFQGELG VRIEDTILVR KGKPEVLETL YKTL