Gene Msed_0852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0852
Symbol
ID	5105212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	786784
End bp	787926
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	51%
IMG OID	640506757
Product	major facilitator transporter
Protein accession	YP_001190950
Protein GI	146303634
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.498161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGAT TTCAGGGCAT GGACAGGAGA TTTTTCCTGA CCACTGGCCT AGTGGCAATG 
CTATTCAATT CCGTGTATCA GTACTCATGG AACGCCTTCT TTCCGTTGCT CGTGAAGGGT 
TTCCATGCAT CTGCAAGCTC CGTAGAGGTC GGCTTTGCGC TGTTCGTGAT TTCCTCGACG 
TCATTTCAAG TGTTGAGTGG AAGGATTTCA GACCTCAGGG GACCTAGAGT GATGGGTTCC 
CTTGGTGTTC TTGCCTTCTC CTTCGGCCTA ATCCTGAGTT CGTTGATACC AAGTCTCCCC 
CTCTTTTACG CCACCTGGAC CCTAGGTAGT ATCGGTGAAG GAGTTCTTTA CGGGATTTCC 
CTGAACCTAG CCATCAAGTG GTACGCGGAA AGAAGGGGGT TGGCCTCAGG TCTAGTTTCC 
ATGGGCTTCG GCTTAGGGGG AGCCCTCGTC AATCCCCTTA TTGAGCTCTC CAACAATTTC 
AGAAGTTCCA TGTTAGCAAT TGGCGTCGCC TCTTTGATCC TTCTCCCGCT CTTTCTTCTC 
TCAAGATACC CAAGTGACGT GAGGGGTTCA TCTCCAGGGG AAACTTTGAG GGAGACCAGG 
TTTTGGCTCA TCTACGTATC CTTCGTTCTA GCCTCTCTTC CCTTACTTGT TGCGTCTTCC 
TCTCTAGGAG AACTAGGTCA GTACCTCAAC AGCGTGGAAT ACACGATTGC CACCATATAC 
TTTCCAATAG CCAGCGGAGT GGGAAGGCCT ATCATGGGGT ACCTCACCGA CCGTCTCGGG 
AGATTAAGGG GAATAGACTA CATGACCGCG GGTATCCTGC TAGGAACATC CCTCGTGGTG 
ATTGGGTTCC TGGGAAGAAA CCTGCTCCTA CTGGCGGGGA TAGCCCTGGT GGGAATAATG 
GGAGGAACTA CTTACCCCCT TTACTCAGCG CTGGTGGGAG ACTTGTACGG GCCTAGATAC 
TCCACCGCAA ACACTTCCCT CCTCTACACT GGTAAGATAG TCTCAGGGGT TCTAGGAAGC 
CTCATCTTTT CCTCGCTGTT TCAGTACAGT AATGTCCTTG GATTGGGTTT TATCATGGGG 
GCGACAGCCC TGTCTACGGT TTCGCTCGCT CTACTTCATA GAATCACAAG AGGAGCAAGC 
TAA

Protein sequence

MSRFQGMDRR FFLTTGLVAM LFNSVYQYSW NAFFPLLVKG FHASASSVEV GFALFVISST 
SFQVLSGRIS DLRGPRVMGS LGVLAFSFGL ILSSLIPSLP LFYATWTLGS IGEGVLYGIS 
LNLAIKWYAE RRGLASGLVS MGFGLGGALV NPLIELSNNF RSSMLAIGVA SLILLPLFLL 
SRYPSDVRGS SPGETLRETR FWLIYVSFVL ASLPLLVASS SLGELGQYLN SVEYTIATIY 
FPIASGVGRP IMGYLTDRLG RLRGIDYMTA GILLGTSLVV IGFLGRNLLL LAGIALVGIM 
GGTTYPLYSA LVGDLYGPRY STANTSLLYT GKIVSGVLGS LIFSSLFQYS NVLGLGFIMG 
ATALSTVSLA LLHRITRGAS