Gene Msed_0596 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0596
Symbol
ID	5105568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	549407
End bp	550765
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	50%
IMG OID	640506500
Product	TBP-interacting protein TIP49
Protein accession	YP_001190695
Protein GI	146303379
COG category	[K] Transcription
COG ID	[COG1224] DNA helicase TIP49, TBP-interacting protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.739423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGA TAAAGGAAGT TAGGAAAGTT GAGACTGGAA GAGCAAGTAT ACATAGTCAT 
ATTACAGGTC TAGGTGTGGA CGAGAATGGA AAGGCTAAGT TCAAGGCAGA TGGCCTAGTG 
GGACAGCTCG AGGCTAGGGA AGCTGCCTGG GTAGTTGTGC AGTTAATAAA GCAGGGTAAA 
ATGGCAGGTA AGGGCATCCT CCTCGTGGGG CCACCGGGAA CTGGTAAGAC GGCTCTCGCC 
GTGGGCATCG CCAAGGAATT GGGTGAGGAT ACGCCCTTCA ACACCCTCAA CGCTTCGGAA 
ATTTACTCTG TAGACCTGAA GAAGACCGAG GTTCTCACTC AAGCGTTAAG GAAGTCCATA 
GGCGTGAGAG TGAGACAAAG AAGGATGGTT TACGAGGGAG TAGTAAAGGA CGTTAAGATG 
AGGATTGCCA GGAGCAGGAT AAATCCCTAC GTTCAGATTC CTAGGGAGGT GGAATTGAAG 
CTTGCCACAA AGGACGAGGA GAGGACTCTC ACTGCTGGGG AAACGATTGC TGAACAGATT 
AGCAAGATGG GAATAAGGAA AGGCGACGTA ATATGGATAG ATGCGGAGAC AGGAAACGTA 
GTCAAGGTGG GAAAGGCTAA GGACGTTGAG GGAGCTAAGA CCTTTGACAT AGATACCGCA 
AGGACAGTAG AGATCCCCAG TGGACCGGTC AAGAAGGAGA AGGAACTCAC TAATACGTTC 
ACCCTTTATG ACCTGGATCT AACCCTCGCA GCCCAGAGCA TCTCCATTAC AGCGTTGTTT 
TCCCTTTGGA GCGAGAGGGA GGTGAGCCAG GACATCAGGA AACAGGTAGA TGCCTACGTG 
AAGGACATGA TTAACAAGGG TACAGCCGAG CTCATACCTG GGGTGTTGTT CATAGACGAC 
GCGCACATGC TGGATATAGA GACTTTCTCG TTCCTCACTA AGGCTCTGGA AGCGGAGTTG 
GCTCCCATCC TAGTTTTAGC CACGAATAGG GGGACAACTA AGATAAGGGG TACGGACGTT 
GAGGCACCTC ACGGCATGCC CCTGGATCTG CTTGACAGGC TTCTCATTAT AACAACTAGG 
CCGTACAGTA AGGAAGAGAG CAGGGAAATC ATTTCCATAC GTGCAGAGGA ATTAGACATC 
GAGCTGGAAC CTGCTGCGCT AGATGAGCTC ACAAGCATGG CTGCTGAGGA AAGCCTCAGA 
TACTCTATCC AGCTACTCGA GCCATCACAG GTGATAGCAA GGAAGGCCGG GAGGGGTATA 
GTCAAGGCAG AAGACGTCAA GGAGGCATCT AGGTTATTCA GTGACTTGAA GAGAAGCGTT 
AAATATGTAA AGGAGTATGA GAACCTATTC CTTAAGTGA

Protein sequence

MAEIKEVRKV ETGRASIHSH ITGLGVDENG KAKFKADGLV GQLEAREAAW VVVQLIKQGK 
MAGKGILLVG PPGTGKTALA VGIAKELGED TPFNTLNASE IYSVDLKKTE VLTQALRKSI 
GVRVRQRRMV YEGVVKDVKM RIARSRINPY VQIPREVELK LATKDEERTL TAGETIAEQI 
SKMGIRKGDV IWIDAETGNV VKVGKAKDVE GAKTFDIDTA RTVEIPSGPV KKEKELTNTF 
TLYDLDLTLA AQSISITALF SLWSEREVSQ DIRKQVDAYV KDMINKGTAE LIPGVLFIDD 
AHMLDIETFS FLTKALEAEL APILVLATNR GTTKIRGTDV EAPHGMPLDL LDRLLIITTR 
PYSKEESREI ISIRAEELDI ELEPAALDEL TSMAAEESLR YSIQLLEPSQ VIARKAGRGI 
VKAEDVKEAS RLFSDLKRSV KYVKEYENLF LK