Gene Msed_0254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0254
Symbol
ID	5103874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	213880
End bp	215199
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	47%
IMG OID	640506160
Product	major facilitator transporter
Protein accession	YP_001190355
Protein GI	146303039
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.180707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCTT TAGATAAAGT AGATAAGGCT GTATGGACCT CAACCCATAG TCTACTCTTT 
GCTTCTCTGG CCTTAGGCTT CTTCATGTGG GGAACAATTA GTACCATAGC TCCCCTTCTA 
TACCCCTCTA TAAACAACGT GTTCTTTATC ATAGCACCCA TAGTCGCAAC CCTAGCTGGG 
AACTTGATCT TCCCTTTCAT CTCTGACAAG ATGTACGGAA GGAAAAGGAC CTTTATTGTT 
ACAATGTCTA TGTACGGTAG TGGAGCGCTC ATTATAGCTA TTGTGTCCCT GGTTTCACAA 
TTCACTAAGA TTCCTCTCAC TAGTCCCGCT CTACTTTACA CCCTAACCTT TGGAATAGTC 
CTAGGAGTAC TTGGGGTGGA AGGGGAAGTT CCAGTTATGT TGTCGTATGC GGCTGAGATG 
ATGCCCATCG TGAGGAGGGA CCAGGTTCTA GTTCTTGCCC CAAACTTTGA CAATATAGGG 
GCCATGGTAG CCTCAGCAAT TGTTCTTGTA TCGGCCTCGT CAAGTGCTCC AACTCTAGAG 
TTGCTCTCCC TGTCCCTCAC CGCACTAGTA GGTTTAGGTT TTCTCATAGC GGTGAGACTT 
AGATTACCCG AGTCCGTTAG ATGGCTATAC GTGAAGGGGT TTAGGGAGAG AGTAGAGGCC 
GAACTTTCCA AGTTGGGGAA CAGGATACAA GAGGTCAAAG AGAACCGGAA CGTAAGCAAG 
TTGAGCCTGC TCTCTAGATA CTGGTTCTTG GTTGCGATTG CCATATCGCA ATACCTGACC 
TACGGCCTCA TGGCCTTCTA CATAGGAGAT TTCTATTTCC CGAGTCTGGA GAATTTCATT 
GTGTTTATTG CTAACGTAGG AGCTAGCGTA GCTGGGGTAA TTGCGGGCTT CGCAGTTAAC 
AGGGTAAAGA GCAGGAAATT CTCACTTTTC TCGTTCCTGG GAGGGACAGT CACGATCCTG 
GGAATACTTC TCACAATCAA CTCTGTCTCC AGTAACATGG GCCTATTTTA CGGCCTCCTT 
CTCCTTAACA TGGCCTTTAG TGAGTTCGGC TGGGCTGTGA GAACCATTTA CGAACCCCTA 
ATCCTTCCAA GCAGTAATAG GGCCTTCATG ATAGGGCTCG TTAGAGTCTT TCCCATCACT 
CTGAGCTCCC TCTCTGTGTA CTTTACGAGT TTTATTAACT CCCCGTTCCT TTACGTGCTA 
TATAATACCG CCCTATGGGC CCTAGGAGCC ATTGCGACCA TTACCTGGTA CTTCAAGGGC 
TACGACGTAA ACATGACTCC CATAGAAGTA TCGTCCCAAA GCGTTGTGAA AGAGGGTTAA

Protein sequence

MEPLDKVDKA VWTSTHSLLF ASLALGFFMW GTISTIAPLL YPSINNVFFI IAPIVATLAG 
NLIFPFISDK MYGRKRTFIV TMSMYGSGAL IIAIVSLVSQ FTKIPLTSPA LLYTLTFGIV 
LGVLGVEGEV PVMLSYAAEM MPIVRRDQVL VLAPNFDNIG AMVASAIVLV SASSSAPTLE 
LLSLSLTALV GLGFLIAVRL RLPESVRWLY VKGFRERVEA ELSKLGNRIQ EVKENRNVSK 
LSLLSRYWFL VAIAISQYLT YGLMAFYIGD FYFPSLENFI VFIANVGASV AGVIAGFAVN 
RVKSRKFSLF SFLGGTVTIL GILLTINSVS SNMGLFYGLL LLNMAFSEFG WAVRTIYEPL 
ILPSSNRAFM IGLVRVFPIT LSSLSVYFTS FINSPFLYVL YNTALWALGA IATITWYFKG 
YDVNMTPIEV SSQSVVKEG