Gene Msed_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1503
Symbol
ID	5104032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1467454
End bp	1469019
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	48%
IMG OID	640507391
Product	amino acid permease-associated region
Protein accession	YP_001191584
Protein GI	146304268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAGTA AAAGAAACGT CTTTATAAGG GAAAGTTCTG GTCTCCTTAA GCAGGTCAAT 
CTTCTTGACG CTGTGATGCT CAACATTGGT AATATGTCAG CTGGCGTCAC GCTATTTGAG 
TCGATCTCCC CTTACATAAA CAACTACCCT GGTGGAGTCC TATGGCTCGC GTCAATAATA 
GGCCTGGTTT TTGCGTTTCC ACAGCTCCTG GTTTATACCT ACATGACACG AAAGATGGGA 
AGGACTGGCG GTGATTATGT CTGGATAAGC AGGAACTTGA ATGGGGCTAT TGGATCCACG 
ATGGCGATAG CGCTCATGCT TGAGTCGGTT GCCTACTTTG CATTAGTGGC CTTCTTCTCG 
GCGTCCAGCA TTAACGCAGT GTTATATACC ATTGGCAGTG TGGACAACTC CCCAAGCTTA 
GTGTCCCTCT CAAACAACGT GTTTGTTAAC CCCTATAACG GCGGTCTCAC CTTTGAGCAG 
AAGGCCCTAT TCTACGGAAT AGCTGCGGCG TTCTTCGTGA TCGTCATCCT GCTGAACATT 
TTCAGATCCA GATGGGGTTA CTCCATTGTG ACAGGTTTCG GTATAGTATC GCTTTCAACC 
CTTGTCATAG CGATGATCGT GATAGGAGCC TCGGCTGGGA GATTTGGAAC AGCCATAACC 
CCGTTCCTTA ACTCTATCAA TTCAAGCTTA GTTAACGTTT ATCAATCCTC ACCACACACG 
GCCTTCCCCA CGAACTTTAG CATAGTTTCA ACGGTGCTAC TATTACCGCT TTTCGCCCTA 
TACACATACC CGTGGATGCA AGCTGGACCT GCGGTATCGG CTGAGTTTAA GCAAAGTGAT 
AGGGTCGCCA AGTTCAACCT AGTGTTTGCC CTTCTTCTCA CAGCTATTCT TGTTACGGGA 
GGCTTCCTGG AGATGGATCT GGTTGCGGGA TATCCCTTCA ACTTTGTTGC CTATCCCTAT 
TTCATTTACA ATTTCTGGAC TGTTGCCATT GCACTGGCAG GAAATCCAGC CCTTCAATGG 
CTCATTGGCA TAGGTGCCAT AGCCTGGAAC TTCTTCGTTT TAGCGTATGG TATAATAGTG 
TTCTCCAGGT ACGTGTTCGC GCTCTCCTTT GACAGGATTC TTCCGGAGAA GTTCGCGGAG 
GTAAACAGGT TCGGTTCACC CGTTTACGCC CATGCCCTCG ATTTAACCAT AACCCTACTA 
TTCCTCCTGG TTCCAGTGTT CTCACTCAAT GCTGCCCTCT CGCTTTATGG AGCAACTATC 
CTTGGCTCAA TCTATTTCCT AGTGGCCAGC ACAGCAGGTG CAATTTATGG TCTAAGAAAC 
AGGGCCAAGG CGATATCCGT GGCTGGTGTA ATCTCGGCCC TCTACTTTGC CTTCCTTACA 
TATGAGGCTG CCACTAACCC ACTGTTTGGC TTTACCACAT CAACAGGCTC GGTCAACTTG 
ACCACATTGA TATTCGTGGT AGGGGTACTC GTAGTTGGCT TCCTGGTTTA CCTGGTATCT 
AACTACAGAA ACAAGAAGAA GGGAATAGAT ATTTCTCTAG TGTTCAAGGA AATTCCTCCA 
GAGTAG

Protein sequence

MSSKRNVFIR ESSGLLKQVN LLDAVMLNIG NMSAGVTLFE SISPYINNYP GGVLWLASII 
GLVFAFPQLL VYTYMTRKMG RTGGDYVWIS RNLNGAIGST MAIALMLESV AYFALVAFFS 
ASSINAVLYT IGSVDNSPSL VSLSNNVFVN PYNGGLTFEQ KALFYGIAAA FFVIVILLNI 
FRSRWGYSIV TGFGIVSLST LVIAMIVIGA SAGRFGTAIT PFLNSINSSL VNVYQSSPHT 
AFPTNFSIVS TVLLLPLFAL YTYPWMQAGP AVSAEFKQSD RVAKFNLVFA LLLTAILVTG 
GFLEMDLVAG YPFNFVAYPY FIYNFWTVAI ALAGNPALQW LIGIGAIAWN FFVLAYGIIV 
FSRYVFALSF DRILPEKFAE VNRFGSPVYA HALDLTITLL FLLVPVFSLN AALSLYGATI 
LGSIYFLVAS TAGAIYGLRN RAKAISVAGV ISALYFAFLT YEAATNPLFG FTTSTGSVNL 
TTLIFVVGVL VVGFLVYLVS NYRNKKKGID ISLVFKEIPP E