Gene Msed_2162 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2162
Symbol
ID	5104201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	2077742
End bp	2078854
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	47%
IMG OID	640508054
Product	major facilitator transporter
Protein accession	YP_001192225
Protein GI	146304909
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000505649
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGACCGT TTCTTATTTT CGTAACGTCG TCGTCATTCT TCCTAGGATA CTTTGCGAGG 
ATAGCGTGGA GCATCGTGTC CGTGTATTCC ACTCTAAGAC CCACCGAAAT TCAGGATAGT 
GTAATATTTT CCCTTTTCTT TCTTGGTTAC GTAATTGTTC AGATCCCATC GGGCATGATA 
TCCGACAGGA GACCTAGGGA GGTAGTGATC TTGGCTCTTG TAGGTCTCGC GATCTCCTCC 
TTTCTCTCCG GCTTCTCGAC TTCAATCCTT CAGGAATACG TGGCCAGCCT GTTGATGGGT 
CTCTCCGCGG GATGGATATA CCCCGTCACC ATAAAGATAT TAGCATCATC CTTTGACAGG 
CGAGAGTTAC CTGTGGCAAT AGGCTACTAC AGCCTGGCGT GGCCACTTTC CATTATTCTT 
GCAGGCTTAA CCTTACCCTA CCTCTCCATA AACATTGGAT GGAGATACTC ATACTACATG 
ATCTCCCTTC TCTGCGTCAT TGTGGCGTTA CTTTACCTGA AGGTGAGGGT TGAAGGGGGA 
GGAAATTCAG GAAAGTTTCA GCTAATAAAG GACAGGAACG TTATTGCGGT GAGTATGGCT 
GGCTTTTTGT TTTTTCTCTC ATACTGGATA ATAACCCTTT ACGCTTATAA ATACTTCTTG 
AAGGTAGGTC TTAACGGATA CGAGGCTGGT ATTGCGTATT CCTTTCTAGC CGTGGCTGGA 
ATACCCTCTA CCGTGATTGC CGGTTACTTA ATACGAAGGA TGGGAGTTAG AACTACCTTA 
TCAACCTTTG AGGGGTTTTA TGGAGTGTTG ACTATCCTTC TGTCCTTTCT AGTTTCAAGT 
GTATCTCTCT TCATTATCTC ATTCCTTATG GGATTCGTGA GATTCGTCAT TACTCCCGCC 
AATTCCAGCG CGGTCTCATT GATAGATAAG GGAAGGGCGG GTAGCGTGTC TGGCTTCGCC 
AACTTTTTCT GGCAGAGTAG CGGGATCGTG GCTCCATTAC TCGCGTCCCT CGTGGTGATT 
CAGCAGGGTT ATCACGTTCT GTGGATAGTA GCGGGGGTCG TAATACTCCT GTCAGCGGTG 
CTGTATAGGG TCTTGTTGAG AATAGAGAGG TAG

Protein sequence

MRPFLIFVTS SSFFLGYFAR IAWSIVSVYS TLRPTEIQDS VIFSLFFLGY VIVQIPSGMI 
SDRRPREVVI LALVGLAISS FLSGFSTSIL QEYVASLLMG LSAGWIYPVT IKILASSFDR 
RELPVAIGYY SLAWPLSIIL AGLTLPYLSI NIGWRYSYYM ISLLCVIVAL LYLKVRVEGG 
GNSGKFQLIK DRNVIAVSMA GFLFFLSYWI ITLYAYKYFL KVGLNGYEAG IAYSFLAVAG 
IPSTVIAGYL IRRMGVRTTL STFEGFYGVL TILLSFLVSS VSLFIISFLM GFVRFVITPA 
NSSAVSLIDK GRAGSVSGFA NFFWQSSGIV APLLASLVVI QQGYHVLWIV AGVVILLSAV 
LYRVLLRIER