Gene Msed_1204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1204
Symbol
ID	5104500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1176165
End bp	1177697
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	49%
IMG OID	640507096
Product	major facilitator transporter
Protein accession	YP_001191289
Protein GI	146303973
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGCG GAATAAAGTA TAAGTCTCCA TATGGCGAAT ACACCATCGT TGTCGATGAT 
GTGGGAAGAA AATATAGGGT AGGAGAGGAC GTCAAGGCAA TAACTAAGAG AATACTAGGC 
TATCCCATAG GTAGAAGGTT GTTGTTACTG GGGGCATGGA TGTCATTTTT CTTCGGAAGC 
GTGCTAGAGT ACGGTTGGGG CGCTGCGTCT ACCACAGTTA TTTCTCACTA TGGATGGTCA 
CTGGCCGAAG GCTTCTTCAA CTACACGGTC TACGTCCTGT TTCAGGCAAC CATATGTGCA 
ACCATATTCC AAAGATTAAG GGAAAAAGGA CTGATTAGCC CCAGGAGGGC TTTGCTGTTT 
GGTGGAGCCC TACTCATGGT GGCGTATTAT CTCTTCTCCA ACTCCTTCGA ACCTTGGATA 
GCGTACTTGG GTTACGCCGC AATAGGAGGT ATAGGGGCGG GTCTTGGATA TGCGGTAGGT 
GGAGGGATAG TTAACAAGTG GTTCCCCGAA AAGAGAGGTT GGAGACTCGG ACTTGTTAAC 
GGCGCGTGGG CGTACGGTGC TGTTCCGTAC ATTCTGCTTT ACATTTATGC ATTCAACTCG 
AGTGACTTCC AGGAGATATT GTACATAACT GGTCTCACTA TAGGGATAGG GCTGATGATA 
GCTGGGCTCC TAGTGGCCGA TCCTCCTAAG CATTGGTGGC CTAAGGACGT GGATCCTATT 
GCAGCCAGGC AAGGTAAGTT GAAGTCAAGG GAGTTGAAAG TTAACCCTCC TGCTGTGGCA 
CAGTGGACTC CTAGGGAAAT GTTGGCAACT CCCATGGGTA AGGCACAGAT GATTTCCTTC 
ACCCTTGCCC TTGCTGCATC CCTCTTCAAC GTATCATTCT ACGCTCCGTT CGGAGCTGCC 
ATGGGCTTCG GTGGAGGTAT CGCATTCGCT GTAGGTGCAG CTGGATTCGC TTTAACCGAC 
GGTCTAGGAA GACCCATGCA AGGTTTCATC TCTAGCCTGA TTGGAAGGAG GAAAGCCGTG 
ACCATATTCT ATACGTTCAT GGGACTAGGA GGTCTAGGAG TCCTTTATGC TGGGCTGGCT 
CACTTAGCAA TACCGTGGGC AATACTCGCA GTGGCTACTG GCGCTGTTTC GGGTGCATGC 
TTCGTCTTCG ATTGGTTACT TATTGCTGAT TACTTCGGCG AGAATAACAT AGGCAAGAAT 
TGGAGCATTC CGTACGCACT AAAGGTGGTG GGAGGAGCCT TCGGAGGTAT AATAGCCGCA 
TTGATACTGA CTTTCGTGAG CGGGGGTACG TGGGCTGACG TCGTGACGGG GGCCTCAATA 
AACATCACTC CACTAGCCTG GGAGGTAGTG TTCTGGATAG GTGCCATTTT CTCGTTAATA 
GCTGCGGGCC TAGTGTGGTT TGTTGAGAAG CCTCCAACCG TAGAAGACTA CATAAAAACT 
AGAATAAAGT TGAATGAGCC CATACCCGAA GAGGTGGCGT CTAAGATACC AAGGGAAAAG 
TTACAAGCCC TAATGCAAAA GTACGGCAGA TAA

Protein sequence

MESGIKYKSP YGEYTIVVDD VGRKYRVGED VKAITKRILG YPIGRRLLLL GAWMSFFFGS 
VLEYGWGAAS TTVISHYGWS LAEGFFNYTV YVLFQATICA TIFQRLREKG LISPRRALLF 
GGALLMVAYY LFSNSFEPWI AYLGYAAIGG IGAGLGYAVG GGIVNKWFPE KRGWRLGLVN 
GAWAYGAVPY ILLYIYAFNS SDFQEILYIT GLTIGIGLMI AGLLVADPPK HWWPKDVDPI 
AARQGKLKSR ELKVNPPAVA QWTPREMLAT PMGKAQMISF TLALAASLFN VSFYAPFGAA 
MGFGGGIAFA VGAAGFALTD GLGRPMQGFI SSLIGRRKAV TIFYTFMGLG GLGVLYAGLA 
HLAIPWAILA VATGAVSGAC FVFDWLLIAD YFGENNIGKN WSIPYALKVV GGAFGGIIAA 
LILTFVSGGT WADVVTGASI NITPLAWEVV FWIGAIFSLI AAGLVWFVEK PPTVEDYIKT 
RIKLNEPIPE EVASKIPREK LQALMQKYGR