Gene Msed_0457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0457
Symbol
ID	5105453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	410146
End bp	411330
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	49%
IMG OID	640506363
Product	major facilitator transporter
Protein accession	YP_001190558
Protein GI	146303242
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATCTA ATTTCATAGG CGCATATCTC TCGTGGGTGA TGGACTCTTA CGATCTCGGG 
GCAGTGGTGA TAACGGCAAC CATCCTAGAG AAGGTATTTT ACCCCACACT GGGTTTGCTT 
GGTGCAGTTT TACCCATTAT TTTTACAGTG GTCACGAGAC CCCTAGGCGG TTTCCTTTTC 
GGGTTTTTCG CTGACCTTCA GGGGAGAAAG AAGGCCCTCA TTATCACGGT CCTAGGTTAT 
TCCCTCTCCA TAGGTCTCAC GGGATTGGTA CCACCCTACG CTCAGATTGG CATACTGGCC 
CCTGTCACAG TTTCCCTGCT GAGGGTAATT CAGGGGATTT TCATTGGCGG TGACGTGTCG 
AGCTCATTCA CCCTAGCCAT GGAGAGCGTA TCAAGGTGGA GGGGGCTTCT TTCTGGCGTC 
ATGCAGTCAG GTACTCTACT AGGTTTCGTG ATCGTAGACT TACTTTTCAC ATCCCTAGCA 
AAGACGCCTG GTTTCTTCGT CACAGGTTGG AGGTATATCT TCTTCATAGG TGTAATCCCT 
GCAGTTTTGG CCCTCCTGAT ACGCGCCAAG GTTACCGAAC CCAAGATATA CGTGGAAGCA 
CAAAAGGAAT ATCCAATTAA GGGTCTATCT CCGTTGTGGC AAACTATCCT GGTTATGATA 
GGTTTCTGGG TAATGATATA CGCCGGACCA CAGTTCATAC CCGTGTATCT GGGACAGGTT 
CTTCACCTAT CTCCGCAGGT GTACGGTTTC CTGGCGTTGA TCATGAACGT TGTTGGCATA 
CCTGCAATGG TACTCTCTGG CCTCCTCTCT GACTTCGTGG GAAGGAAAGT CATGGGCATT 
GTGGGGGTAG TTGTGGGGTT ACTCACGGCT TCATGGTTCT ACCTTGCAGG GTCTCCCACA 
TTATTGTCCA TGGTGCTTTT CGGCTTTGGA ATGAACCTTG CTTCAGCCAT ATCTCCCAGC 
TACCTGGCTG AGAGGTTTAA GACGTTTAGT AGGGCCACGG GAGTGGGCTT CTCTTACAAC 
GGAGCCTTCA TAGTTGCTGG TTTTACTCAA CTGTTTATTT CTCAGCTTTC CACGGTGACC 
TCAGTATCAC ATTCGGCAGT GATTGTTCTT GGTCTAGGGG CGATAATAGC TGGGATTGGT 
CTAGCAGTAG GTCCAGAAAC CTTGAAGGTC TCAAATCTTA ACTAG

Protein sequence

MRSNFIGAYL SWVMDSYDLG AVVITATILE KVFYPTLGLL GAVLPIIFTV VTRPLGGFLF 
GFFADLQGRK KALIITVLGY SLSIGLTGLV PPYAQIGILA PVTVSLLRVI QGIFIGGDVS 
SSFTLAMESV SRWRGLLSGV MQSGTLLGFV IVDLLFTSLA KTPGFFVTGW RYIFFIGVIP 
AVLALLIRAK VTEPKIYVEA QKEYPIKGLS PLWQTILVMI GFWVMIYAGP QFIPVYLGQV 
LHLSPQVYGF LALIMNVVGI PAMVLSGLLS DFVGRKVMGI VGVVVGLLTA SWFYLAGSPT 
LLSMVLFGFG MNLASAISPS YLAERFKTFS RATGVGFSYN GAFIVAGFTQ LFISQLSTVT 
SVSHSAVIVL GLGAIIAGIG LAVGPETLKV SNLN