Gene Msed_0417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0417
Symbol
ID	5105534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	368272
End bp	369366
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	50%
IMG OID	640506323
Product	major facilitator transporter
Protein accession	YP_001190518
Protein GI	146303202
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.117512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCACG TAACGAAGCT GGCCTTTTCC GGTGGGATAA GATCCTTTAC GTCGTCTCTA 
ATCTGGCCGT ATATAGGGTT TGGCCTCTAT AAGTACCTTG GTTTGTCCCT GGTTCAGGTC 
AGCCAGTTCT ATCTAACCCA GCTCTTGATC TCGTCGATAG CCTATGTCAT TGGGGGATAC 
TTGACAGATT ACCTAGGGAG GAGACTCGTG ATGACGCTAG CTACTTCGCT TTCCTCGCTA 
GTGCTCACTC TAGCCTTTTT CCTTAACACT GCGGGAGTCA TAGGAATGGT TCTGCTCCAG 
TCAGGATTCA GTAGCATTTA TGCTGTAGCT AACATGGCCA GCGTAGGGGA CATGGGAGGT 
AACTTTAAGC AACTTGTGAG GTCGTTTAGT GTAATACGCG TTGGGATCAA TGCTGGATGG 
GCCATAGGTC CTGCAATTGG AGGTTTACTT CTGGGGGATA TAGGATTCAA ACCACTGCTA 
CTCCTGGGCG GGGTCCTGTC AGTGGTTGCC ATTCCCTTTG TGTACTCCCT TCCAGATCAC 
AAGGGGAGGG TTAGGTTCTT CCTTCCCAAC AGGAAGTTCG CCATGTTTCT GATACCCACC 
CTTCTCACCT TTACTGTAAT GGGACAGCTG GGATTTCCTC TAGTTACCTA CTACAGTGGA 
CTTGGCATTG CGGTCTGGCA GGTGGGTCTC CTCTACGCCG TCAACGGAGG ACTCATTATA 
CTCCTGCAGA GATGGATTGG GGAAAGGGTA TCTGGAAATT ATAGGACCTG GATATCCGTA 
GGAATGCTCA TGTACTCTTT GAGTTACGGG CTTGTATCTC TGGTCTCTAA CGTATGGGAA 
GCCCTTCTAG ACGTCGTGGG AATTACCTTG GCTGAGATGA TTGTGTCTCC CCTATCCCAA 
TCCATTTCCA CATCCCTAGC TGAAAGTGAG ACGAGGGGAA CCTACTCCGG GATATATGGA 
CTAGTAAGTT CCATGGGGAG AACCCTTGGT TCCTCCATGT CCGCCTTCCT ACTCACTAGG 
GGAGGGGAGG TGACGTGGTC GTCAGTGGGA GGTGTTGGGG CAGTCTCAGC TATTCTTTAC 
CTAGCATTGA TTTGA

Protein sequence

MNHVTKLAFS GGIRSFTSSL IWPYIGFGLY KYLGLSLVQV SQFYLTQLLI SSIAYVIGGY 
LTDYLGRRLV MTLATSLSSL VLTLAFFLNT AGVIGMVLLQ SGFSSIYAVA NMASVGDMGG 
NFKQLVRSFS VIRVGINAGW AIGPAIGGLL LGDIGFKPLL LLGGVLSVVA IPFVYSLPDH 
KGRVRFFLPN RKFAMFLIPT LLTFTVMGQL GFPLVTYYSG LGIAVWQVGL LYAVNGGLII 
LLQRWIGERV SGNYRTWISV GMLMYSLSYG LVSLVSNVWE ALLDVVGITL AEMIVSPLSQ 
SISTSLAESE TRGTYSGIYG LVSSMGRTLG SSMSAFLLTR GGEVTWSSVG GVGAVSAILY 
LALI