Gene Msed_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0114
Symbol
ID	5104967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	94737
End bp	96128
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	41%
IMG OID	640506013
Product	preprotein translocase subunit SecY
Protein accession	YP_001190215
Protein GI	146302899
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0201] Preprotein translocase subunit SecY
TIGRFAM ID	[TIGR00967] preprotein translocase, SecY subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000441427
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000810769
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCACTTA CTGACGCGCT AGCCAAGTTG GGTCAGGTTC TCCCAGCAGT TACTAAGCCA 
GAGGAAAAAC CAACGTTAAA CAAGAAACTG CTATGGTCCA TAGTGGGAGT AGTAGTCTAT 
CTATTAATGT CATCTGTTCC CCTTTATGGG ATCCAGAGTA CTGCCCTAAG TAACTTCCTC 
TTGGAACAAG TAATATTTGC GTCTACCGCT GGCACGTTAG CCCAGCTTGG AATTGGACCC 
ATAATCACTG CCGGACTAAT AATGCAAATA CTTGTTGGAT CTAAACTGCT CAATCTTAAC 
TTAAACGATG AAGAAGATAA GGCAAAGTTC ACAGAAGCAC AGAAGGGGTT AGCCTTTCTT 
TTCATCTTGT TGGAGTCATT TCTATTTGCA TTTGCATTGA CTAGGTCAAG TGGATTGTCC 
AATATCAATA TTCCGTTAAT TGTCGCTGGG CAATTGATTG TTGCAACTTA CCTTATACTA 
TTACTGGATG AATTAATTCA GAAAGGTTGG GGACTAGGCT CTGGAGTAAG CTTGTTCATC 
CTCGCTGGAA CAATGAAAAT AATATTCTGG TATATGTTCG GAATTGTGAA CGTTCAATCT 
CAAAATCTCC CTGTCGGATT CTTCCCGTCG CTCGTCACAA CCATAATCGA TCACGGCAAC 
TTACTTAATC TGGTGGTCAA CACGACGAAA TCTTTTCAGC CTGACCTAGT GGGGCTAATT 
ACTACAATAG GTCTAATATT TCTAATAATA TATCTGACTT CCATAAATGT TCAAATACCT 
ATTACCTCTC AGAAACTAAG GGGAATAAGA AGAACGATTC CGCTCAACTT CCTTTATGTC 
AGTAGCATAC CCGTTATATT TGTAAGTGTT CTTGGTGCAG ATATTGAACT TTTCTCTTCC 
TTAACCTCTT ATATATCATC CTCTGCTAGC AGTGTTCTAA ACGCAATCCA ATCCGCATTT 
ATATTTCCAC CACCTAGCAC CACAATACCT CACAGTGTCT ACGCTGTGGT ACTAGACCCA 
GTAGGCGCAG TGATTTATTC TGTAGTTTTC ATCGTGTTAG GTATACTCTT TGGAATAGTA 
TGGGTAGAGG TATCTGGTCT TGATCCTGCC ACTCAAGCTC AAAACCTTGT TGATGCTGGG 
ATAGAGATCC CTGGCATGAG GAACAATCCA AAGATGATAG AGGCTGTATT GGCCAAGTAT 
ATCTATCCTC TAGCCTTCTT TAGTTCCCTA ATAGTCAGTG TGATAGCGGT AGGGGCTACG 
CTTTTAGGAG TATACGGAAC TGGTGTTGGA ATACTCTTGG CGGTGTCCAT AGCGATGCAG 
TATTACAGTC TATTAGCATA CGAAAGATCT ATAGAGATGT ACCCCTTGTT AAAGAGATTG 
ATAGGTGAAT AG

Protein sequence

MSLTDALAKL GQVLPAVTKP EEKPTLNKKL LWSIVGVVVY LLMSSVPLYG IQSTALSNFL 
LEQVIFASTA GTLAQLGIGP IITAGLIMQI LVGSKLLNLN LNDEEDKAKF TEAQKGLAFL 
FILLESFLFA FALTRSSGLS NINIPLIVAG QLIVATYLIL LLDELIQKGW GLGSGVSLFI 
LAGTMKIIFW YMFGIVNVQS QNLPVGFFPS LVTTIIDHGN LLNLVVNTTK SFQPDLVGLI 
TTIGLIFLII YLTSINVQIP ITSQKLRGIR RTIPLNFLYV SSIPVIFVSV LGADIELFSS 
LTSYISSSAS SVLNAIQSAF IFPPPSTTIP HSVYAVVLDP VGAVIYSVVF IVLGILFGIV 
WVEVSGLDPA TQAQNLVDAG IEIPGMRNNP KMIEAVLAKY IYPLAFFSSL IVSVIAVGAT 
LLGVYGTGVG ILLAVSIAMQ YYSLLAYERS IEMYPLLKRL IGE