Gene Msed_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1023
Symbol
ID	5104326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	946368
End bp	948167
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	36%
IMG OID	640506922
Product	ATPase
Protein accession	YP_001191115
Protein GI	146303799
COG category	[R] General function prediction only
COG ID	[COG0714] MoxR-like ATPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0862859
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGATG ATTGGTTTAA GTTGAGACAA GGCTTGGAAT ATCTGGATAC ATATCTCACT 
ACGAACAATG AGAAAGAACT AAATGAGTCG ATTGATAGAA TAATAAGTCT AATAGATAAA 
AAGATAATTA GTCAAACCGA TATTAAGGAA AATTCTGCTA GAGAAGAACC AAATCCAATA 
TGTGTTTTTG TTGGAAACAA GGATAATTAT GAACATTGGA TGTACTCTTT TAGATATTCT 
TTAGAAGCAG AAGTAAGTTA CATGCTGTGG GGGGATACAG TTAGCTCCAA GTCAAAGAGT 
ACTCCGGACG AGGAGACACA TTTCGAATAT GGAACTTTAG TCGATGCCTA TCGAAAACAA 
ATTAAAGACG GGAATATAGT AGACCCGCTT TTTGCAATAT TTTATCTAAA TAAATCATTC 
TTTGGTTTTG GAATAATTAC GGACATTAAC TATGATATTT TTAGAAATTT TACGTATTGG 
AAAGAGGTTA GTTTCGATAA AATATGGAAA ATGCGCGTTA GAATGAAAGT CCTATATATT 
CACAAAAAGC TTAGGGACAA GCCTTTTGAA AATTGGGCGT CTTTTGATGA AATTTCGTTT 
GATCCGTTAA CAGATGGGAA AATATCATTA AATGCCAATA ATTGCTATCG TAAAAAAGAA 
GTAATGGAAT ACTTACTAAA TGAATATATT AAACCAAAAA AGGACGAGAT AAGGAATACC 
CTACTCTTCT ATAGGGATAT CTATCAAAAA CTCCGCGCAT CTCAGGAGAG AAAGTTATCC 
TCTCTCCAAA ACCTAACAAC TGGAAACCTT CAATTTAAAC CCCAAATCAG CTGCGTTAAG 
ACTGGAGACA TAGTCCTAAA TGACCTTTAT CTAGGCACTG GACTAGAGAC AACTCAGTTT 
AGCTCAATCT TGAAGGAGAG TATGCGTGGT GGAAATGTAC TGTTTGTAGG CCCCCCAGGT 
GTCGGAAAAA CTGAACTGGC TACACGTCTC GCCCGTTATT ACGCTGGAGA CAATTGCTAT 
ACAATAACGA CTGCAAATTC ACTATGGTTT AGGAGAGATG TTATAGGTGG TGAAACCATT 
CAGGCAGGTT CTGTTATATG GAAGAGCGGA TTGCTAGTGA AAGCATATAA TAGGGCGGCC 
GAAATTCCTT CCGCAAATAG CTTCGCGATA ATAATAGACG AGATAAATAG AGCTGACATA 
GATAAGGCGT TTGGTGAATT TTTCACAATA TTTTCCAGTA CCGAACTTAG CAATTGGAAG 
TTACCATCTT CCCTAGTTGA TGAGATTAAG AGTTACGGGA ATAACGTGGA TGAGGAAGCT 
AGAAGATTCC TAGAGAATTA CGAGAGATTG GGAGATAAAC CACTGACTGG GCTAAGAATA 
ATCGCCACCA TGAACCTAAT AGACTTTAGG AATCTCTTCG ACATTGGTAG TGCACTGACT 
AGAAGGTTCT TTGTTTTTCA ATTTGAGTAC CCAAAGGGAA TTGAGGATAT ATCGAAACTA 
AATCTTCAAG TAGATAAGGA GATAAAGGAC ATTATAAAAT GTCTGAGAGA GAAATTCTCG 
TCAAGACCTA GAGGTGACTT ACTTGAGGGA TTTGATACCA GATCCGGATT TAATATATCG 
CCTGCGTCCC TCAAGAAGGC AATAAATATT TATAATTCTA CTCAAAATAA AGATATACAT 
ATATTTCGTG AGATATTAAG AAGCACGCTT GGAACCGTGA ACTTGAAGGA CTTGGAGAAC 
TACAATAAAT ACTTTGAAGA ATGTGAGAAG AATGTTAATC AGGGACAAAC AACTAATTGA

Protein sequence

MYDDWFKLRQ GLEYLDTYLT TNNEKELNES IDRIISLIDK KIISQTDIKE NSAREEPNPI 
CVFVGNKDNY EHWMYSFRYS LEAEVSYMLW GDTVSSKSKS TPDEETHFEY GTLVDAYRKQ 
IKDGNIVDPL FAIFYLNKSF FGFGIITDIN YDIFRNFTYW KEVSFDKIWK MRVRMKVLYI 
HKKLRDKPFE NWASFDEISF DPLTDGKISL NANNCYRKKE VMEYLLNEYI KPKKDEIRNT 
LLFYRDIYQK LRASQERKLS SLQNLTTGNL QFKPQISCVK TGDIVLNDLY LGTGLETTQF 
SSILKESMRG GNVLFVGPPG VGKTELATRL ARYYAGDNCY TITTANSLWF RRDVIGGETI 
QAGSVIWKSG LLVKAYNRAA EIPSANSFAI IIDEINRADI DKAFGEFFTI FSSTELSNWK 
LPSSLVDEIK SYGNNVDEEA RRFLENYERL GDKPLTGLRI IATMNLIDFR NLFDIGSALT 
RRFFVFQFEY PKGIEDISKL NLQVDKEIKD IIKCLREKFS SRPRGDLLEG FDTRSGFNIS 
PASLKKAINI YNSTQNKDIH IFREILRSTL GTVNLKDLEN YNKYFEECEK NVNQGQTTN