Gene Msed_1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1235
Symbol
ID	5103849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1214340
End bp	1215419
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	50%
IMG OID	640507127
Product	SMC domain-containing protein
Protein accession	YP_001191320
Protein GI	146304004
COG category	[R] General function prediction only
COG ID	[COG1106] Predicted ATPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTACTT CCATCAAGAT CAAGAACTTC AAGAGCTTCA GGGACGTCAC ACTTAATCTC 
GGAAAAATAA GTGTAGTGGG CCCAAATGGT AGTGGAAAGA CTAACCTAGT TGATGCGTTC 
TCCCTTCTAA AACAGGTTTT GAGACCCTCC TCGCTTTCAC CCTACCCTTT CGCGAGATGG 
GGCGAATACA AGAACGTAGT GTTCATGCAA GATCCTGGTT TGGATATCTC CTTTGAGCTA 
GAGGGAAAAC ACAAGGGAAT GGAGTACAGA TATTTCCTTG AGATCAACGG CGAGCACTCC 
TTCACCGTGA AAAGGGAGGA GGTCAGGCTA GGGGACAGGG AAATAGAGAG GGAGAGAGAC 
GCGGTCAAGA TTGGGGACAA AAGAATAGAG ATCCCCGTGA ACTACAGTGT TTTCAATTTA 
TTTAACGCAC CTGATCCTGG CTCACCTGAT TTGCTCTCCC TTTCTCTGGA GGGCGAATTG 
AAGGACTTCA TGCTAAACTT CTTCAACGAC GTCCTTATTC TTCGTTCCAC GGAGAGAGCC 
CTACAACCTG CTCACGTCTC GGCTCCTGAG GGGATTGGGG AGGACGGGGC CGGTCTCCCC 
AGGGCTCTGT TGGGGAAAAA TCTGCCAGGT CAGGTGAGTA ACTTCTTGGA CTCCCTAAAC 
ATGAGCCTAA GGGTAACTGT CTCAGACGAC GGTAATGTTA CGATCTCCGC TGTGGGGGTC 
GTGAATGGGA GAGAAATAGT CATTCCCCCA ACCTCGATCC CCTCGGGAGT GGTCGAGATG 
ATAACCCTTC TGACCTCAAT CGACGTGCTT AAGCCCAGCC TGGTAGTTAT AGACGGGTTG 
GAAAATTCCC TGCACCTGAA GTTCATGGAG AAGTTAATTG ACGTTCTTAG ATACTCTGAG 
CCCCAGTTCC TGATCACAAC GCACTCGCCC CTGGTCATCG ACTTCCTGGA TCCCTCAGAG 
CTCGTGATCC TTGATAGGGA GACTGGAGAG ACTAGGGTAA CCACGATTCA AGACCCTGAG 
GGATTGAAGA AAAAGCTCCT GGAGGAGGGT CTGACCCTAG GCGAATGGAT CATATACTAG

Protein sequence

MITSIKIKNF KSFRDVTLNL GKISVVGPNG SGKTNLVDAF SLLKQVLRPS SLSPYPFARW 
GEYKNVVFMQ DPGLDISFEL EGKHKGMEYR YFLEINGEHS FTVKREEVRL GDREIERERD 
AVKIGDKRIE IPVNYSVFNL FNAPDPGSPD LLSLSLEGEL KDFMLNFFND VLILRSTERA 
LQPAHVSAPE GIGEDGAGLP RALLGKNLPG QVSNFLDSLN MSLRVTVSDD GNVTISAVGV 
VNGREIVIPP TSIPSGVVEM ITLLTSIDVL KPSLVVIDGL ENSLHLKFME KLIDVLRYSE 
PQFLITTHSP LVIDFLDPSE LVILDRETGE TRVTTIQDPE GLKKKLLEEG LTLGEWIIY