Gene Msed_0255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0255
Symbol
ID	5103875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	215235
End bp	216422
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	46%
IMG OID	640506161
Product	major facilitator transporter
Protein accession	YP_001190356
Protein GI	146303040
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.299198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCGT ACCTACACGC AACACTTGCC TCCACAATCG CATGGGCAGG AAATATTTAT 
GACCTGCTAA TTATTACTTA CGTTTATCAA TATATTGAAA GCACATTTCA CATAGGCTAT 
GTAATGGTTT CCCTACTCTT TTCCTTTGGA CTATTGGGGA GGGTGGTTGG AGGTACACTC 
TTTGGAAGGT TTTCGGACAA GTACGGAAGG AAACCTGTCC TGATATTCAC TACGTTGGGG 
TATTCGTTGT CTCATGGGAT TATGGCCTTT TCCCCAAACG TGATAGTACT TTTCCTGGCG 
AGACTGTTTG AGGGAGTATT CATGGGAGGA GAGTGGACTG CTGGAACAGT AATAGCCTAT 
GAGAGTGCCC CCGTATCAGT CAGGGGAATA CTTACAGGGA TAGTCCAGTC TGGGTATGGA 
ATGGGTTACG CGCTCACAGG GGCAATGTAC ATCTACTTTT CACCTCTCAT TTCGGAGGAT 
TGGAGAATCT TTCTAGCCAC TGGAACGTTT CCCCTCCTTC TGGTACCTTA CATGAAACTG 
AAGGTTCCAG AATCCAAACC CACAAGGGTA TCCAAGGTAA AAGTTGAGTA CAGGGATTAC 
CTAAACCTCA TCCTTAAGTC TACCTTGGCA ATGTCAGGGA TGTTTGTAGC CTACTTCTCT 
GTTTTCGGAA ATTATCCAAC CTTTGCGGAA AAATTAATTG GAATCTCTCC CTCTACTTTA 
GGGTTAACAC TACTGATCTC CAACGTAGGA CTTGCAATAT CCTTTATCGT GTTTGGTCGC 
CTTGCAGACA GGATAAACGT AAGGAAACTA ATCCTTTCTG CCCTGGTTAC GCTCACAGTA 
TCCCTCTTCT TTACCGTTCC TGGATTCATC AACCTAGGCC CTCTTGCCTC AATCATCTCT 
ACGATGGTTT ATGCCTCATC GTGCGGATTC TGGCCCCTGA TACCGCTTCT CCTTGCCCAC 
TCCGTTCCCG TGGAGGTTAG GGGGCTCTTG TCGGGAATGT CCTATAACAT AGGCGGGCTT 
GTGGGAGGCA TTGCGGAAGT CATCACGGGG ATAGCAATGC AATACATGGG TATCTTGGGA 
ATGGCCAAGA TAATCGACAT CATTAATCTG GTTGCTCTCA TCACGGTGTT TATTTCAGTC 
ATTACATGGC CAAGGGCAGC CATCCATACT TCGAGCCATA ATGTATAA

Protein sequence

MKPYLHATLA STIAWAGNIY DLLIITYVYQ YIESTFHIGY VMVSLLFSFG LLGRVVGGTL 
FGRFSDKYGR KPVLIFTTLG YSLSHGIMAF SPNVIVLFLA RLFEGVFMGG EWTAGTVIAY 
ESAPVSVRGI LTGIVQSGYG MGYALTGAMY IYFSPLISED WRIFLATGTF PLLLVPYMKL 
KVPESKPTRV SKVKVEYRDY LNLILKSTLA MSGMFVAYFS VFGNYPTFAE KLIGISPSTL 
GLTLLISNVG LAISFIVFGR LADRINVRKL ILSALVTLTV SLFFTVPGFI NLGPLASIIS 
TMVYASSCGF WPLIPLLLAH SVPVEVRGLL SGMSYNIGGL VGGIAEVITG IAMQYMGILG 
MAKIIDIINL VALITVFISV ITWPRAAIHT SSHNV