Gene Msed_0588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0588
Symbol
ID	5105560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	541480
End bp	542784
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	49%
IMG OID	640506492
Product	amino acid permease-associated region
Protein accession	YP_001190687
Protein GI	146303371
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.894374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.71791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGCC TATCCAAAAG GCTCAAAATA AGGGAATCCT CGCTACCTGC CTACCTAGTT 
TTCAGTCAGT CCTTGGCATC CATTGCTCCT CTAAGCTCGA CGGCGGCTTA CCTAACAGCT 
ACTCTTCTCC TGGCTGGAAC CTCTAGTGGT ATTGCCTCAA TACTGGGCGT GTTGATGTAC 
TCCCTTTGGG TCTATGTGGG ATATCAGCTC TCGAGGTTTT TCCCATCTGA GGGAGGGACC 
TACACCTTTT CTAGACATAT GTACCCTGAA AGGGTTGCAA CTATTCTGGG ATGGATGTAC 
TGGGGGAGTT ACATGTTTTA CCTGATATCT ACCTCAACTT ACGCTACCGG AGTGCTTCTC 
CCTCTTCTAG GAGCACCGAT TTCCATAGAC CGGTTAATGG AGGTTGTGCT TCCATCAGCT 
ATAGTACTGC TCATGATTAC CGGGATCAGG CCACCGCTTT ACTATAGTCT AGTAACTTCA 
CTGGTGGAGA TTGCCGTAAT CGTGGTTCTG GGCATAACGG TGATTGCACA TAGGGGGCTT 
TCCCTAGTCC CGTTAACGCC CTCCGCGGGA CTGTCTCAGG TGTTAAGCGG GGCCATGGCC 
ACCTCTTTCT CGATAGCTGG TGGTGGTGCT GCCTTCTTCC TAGGGAAGGA GGCCAGAGGA 
AAGGGAAAGA CTGTAAGCAA GTCTTACCTG TTGGCATTTC TCCTTGCCTC CGGAGCCATA 
GTGTTCTCCT CGATTTACCT CGTAACAGCT GGAGGTTCAA CTCAGGGAGT TGAAAACCTA 
GCCAATACTG GCTTTCCCGG TCTTACTGTC GCGAATCAGT ACATGGGAGA ATCCTTTGCC 
TCAGCTATGC TACTACTTAC TGTGAATAGT TTAATTGGTT CTCTAATTGC AGCCTACGTG 
GCCTTATCTA GACTGACCTT TTCCCTGCTT AGAACTGACT TACCAAAGTC TACCCTTATT 
GTGGGTTCCC TCTTCCTGGG AATCAACGGG GTAATAGCTG GGCTGGGGAA TCTAGTACAG 
TGGTATCAAT ACTTTTTCCT GGGCTCGTTA ACCGCACTCT TCATCACACA TGCCTCGCTT 
TCCCTAGGCC TTCCCAAGAT CAGGAATAAG CTAGCCTTAA GCCTTCTCAA GTCCTTTCCG 
GGGATTCTCT CAGCCCTTCT CATGATGGTA GGCCTTTACT CCATTTACCT TGAGGTTGGA 
GAGGAACTGG TTGTGGGGAT CTTAGCGTGT ATAGTTCTCG TCATGGTAGG AGTGATTCAG 
GGCCTAATAT CCCGAAGAGG GGAGGGAAAG AGTAATATTT CATGA

Protein sequence

MASLSKRLKI RESSLPAYLV FSQSLASIAP LSSTAAYLTA TLLLAGTSSG IASILGVLMY 
SLWVYVGYQL SRFFPSEGGT YTFSRHMYPE RVATILGWMY WGSYMFYLIS TSTYATGVLL 
PLLGAPISID RLMEVVLPSA IVLLMITGIR PPLYYSLVTS LVEIAVIVVL GITVIAHRGL 
SLVPLTPSAG LSQVLSGAMA TSFSIAGGGA AFFLGKEARG KGKTVSKSYL LAFLLASGAI 
VFSSIYLVTA GGSTQGVENL ANTGFPGLTV ANQYMGESFA SAMLLLTVNS LIGSLIAAYV 
ALSRLTFSLL RTDLPKSTLI VGSLFLGING VIAGLGNLVQ WYQYFFLGSL TALFITHASL 
SLGLPKIRNK LALSLLKSFP GILSALLMMV GLYSIYLEVG EELVVGILAC IVLVMVGVIQ 
GLISRRGEGK SNIS