Gene Msed_0891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0891
Symbol
ID	5103537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	825943
End bp	827355
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	48%
IMG OID	640506794
Product	major facilitator transporter
Protein accession	YP_001190987
Protein GI	146303671
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGAA CAGTAATCCT TCTAGTACTT GTCCTTGGGA CGTTAATGGC CGCGGTTGAC 
GGAACCATTG TTCTCTTGGC CTTGCCTCAA ATTGCTCAGG ATTTACACGC AGATCTCTTT 
ACGGCAATTT GGGTTCTCTT GGCTTACCTG CTGGTAACGG CCATACTCAC AACTCAGACT 
GGAAGAATAG GGGATATTTA CGGGAGGGCC AAGATCTTTA ACCTGGGTTT CGTAATTTTC 
ACCGTTGCCT CAGCGTTATG TGGATTGTCA AACTCCATTT ATCTGTTAAT TGCATTTAGA 
CTAATTCAGG GGGTTGGAGG GGCGATGATG ACTGCAAACA GCGGGGCAAT AGTTGCAGAT 
CACTTTCCCC CTAACATGAT GGGGAGGGCT TACGGTTACA CTTCACTGGG TTGGAACATA 
GGAGCCCTTC TAGGAATAGT CTTGGGAGGA ACCTTGACCA CTTTCTTTGG ATGGCCTTAC 
ATCTTTTACA TTAATGTCCC CATAGGGGTT GTAGCAACTA TCCTTGGTGT GAAGTACATT 
AAGGACGTCA ACAAGGTGAA AAGGGAACTT GACGTCACGG GAGCAGTACT CCTTGGAGTT 
GCACTGGTTC TCGTTTCCTA TTCTTCCATT GTAATGGCGA GCGTCGGGGT TGATTCCCTG 
AATCTGGGAA TACTGGTCGT GGGGATAATA CTCGTTGGGG CCTTCATCTT TAACGAGAGT 
AGGGCGAAGA GTCCCGTGAT AGACCTAAAG ATGTTTAGGT ACAGGCTCCT GGGTTACTCC 
TTGACCGCTA CCTTCCTGCA GGCAATAGGG GGACTAGCCA TCACCTTTCT CCTCATCATG 
TACCTTCAGG GCGTAAGGGG GCTATCTCCC CTAGATGCGT CCCTGTTACT TCTTCCAGGT 
TATGTTGTGG CCAGCTTCCT AGCACCCTAC ATGGGTAAGT TAACCGATAG GTATGGTTCC 
AGATGGTTTG CCACCGGAGG GATAGCCATC ATCATGCTGT CTGTGATAAT GTTCTATTTC 
GTGCTAACGC CGGAAACTCC TTACACATGG ATACTGCTAA TTTCTGGGAT TAATGGTGTG 
GGTTCAGGGA TGTTCTGGCC ATCTAACACC AGTGCCATAA TGTCAAGTGC TCCCAAGGGA 
TACTTTGGTT CAGTCTCAGG TCTCTCGAGG ACCCTTGGAA ACGTGGGAAT AATTCTGAGC 
TACGTGATAA CACTTTCGGT GGCAGCGGCT GCAATTCCTA AGGAGGTGGC CTTTAAGATA 
TTCTTGGGAA CCTCCAAGTT AGATGGTGGG CTCTCCTCTA TTTTCGTGGT AGGGCTTCAT 
TACGCCTTCT TGATCTCGGC AGTGGTGCTG GCTGTGGCCA CGTTCTTCTC CTTCCTTAGG 
GGGAAAGAGA TACGTATGGA GGAGAAAGCC TAG

Protein sequence

MNRTVILLVL VLGTLMAAVD GTIVLLALPQ IAQDLHADLF TAIWVLLAYL LVTAILTTQT 
GRIGDIYGRA KIFNLGFVIF TVASALCGLS NSIYLLIAFR LIQGVGGAMM TANSGAIVAD 
HFPPNMMGRA YGYTSLGWNI GALLGIVLGG TLTTFFGWPY IFYINVPIGV VATILGVKYI 
KDVNKVKREL DVTGAVLLGV ALVLVSYSSI VMASVGVDSL NLGILVVGII LVGAFIFNES 
RAKSPVIDLK MFRYRLLGYS LTATFLQAIG GLAITFLLIM YLQGVRGLSP LDASLLLLPG 
YVVASFLAPY MGKLTDRYGS RWFATGGIAI IMLSVIMFYF VLTPETPYTW ILLISGINGV 
GSGMFWPSNT SAIMSSAPKG YFGSVSGLSR TLGNVGIILS YVITLSVAAA AIPKEVAFKI 
FLGTSKLDGG LSSIFVVGLH YAFLISAVVL AVATFFSFLR GKEIRMEEKA