Gene Msed_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1046
Symbol
ID	5104428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	973665
End bp	975692
Gene Length	2028 bp
Protein Length	675 aa
Translation table	11
GC content	47%
IMG OID	640506942
Product	extracellular solute-binding protein
Protein accession	YP_001191135
Protein GI	146303819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTC GAAAAGGTAT AAGTCGCACG TTGGTAGCAG GTATAATTGT GGTAATTGTT 
ATAATAGCTG CAGTGGCGTT TATTTCCCTA TCAAGACATC CCACAACAAC TACCCCAGTC 
AACGTGACCC ATACCACTAA CACGACCACC ACTAAGACTA ACGTGACTGT GCCCACAACG 
AATGTCACAT CGATTCCCTC ATCAATTACA GTAGACGAGG CAACTCCGCC AGTTAGCGTG 
GATCCGGCGT CCAGTTTTGA CGTTGCTGGG GGAGAATTGC TACAGAACGT GTATCAAACC 
CTCGTGTTCT ACAACGGAAC TAATACGTCC AGTTTTGTGG GAGTCTTGGC AGAAAATTAC 
ACAGTATTGA ACAACGGAAC CACTTACGTG TTCCACCTCT GGCCATTTAT AACCTTCAGC 
AATGGTGATC CATTGAACGC AACCGACGTC TGGTTCTCGG TGTACAGAAC AATGTTAATG 
AATCTTGGAA TCTCGGTCTA CGTTAGTCAA GGACTATCAG TCAATAACGG ACTTGGATTT 
GTAGGGAAGC TACCCAGTGG CGCTACCGGG ACTATCGAAT TGCCCAACGG TACTCTTCAG 
GCCCTCGAAT ATGCTGGTTA CACTTTCCCC TCAAACAAAA CTCAGGCATA CGAACAGGCA 
GCCTATGATT TGGCCTATAT TCTTTCCCAC TTCAATGTAA GCAATCAGAC CATTCAAAAG 
GTCATGAGTT ATCCCTATCA GGCAGTGGTC GTGGTGAATC CCTATACTGT TCAATTCAAC 
CTTCAGTATC CATACTCTGC ATTCCTAGCT GCAATTTCCA CATCTGCTGG AGCCGTAGTT 
GATCCAGTCT TCGTAGACGA ACATGGAGGA GTCCAGATAG ATACTGCCAA CACTTACCTT 
TCAACTCACG CCCTAGGCTC AGGTCCCTAC ATGTTGGAAA CTCCACTGGG TCAGTCCTAC 
GTAATCCTGC AGGCAAATCC CAATTACTGG GCGTCCAAGG TTCCTCAGTC TGAGAGAAAC 
TTCATGTTAG CTATTCCCAA GATCGAGACC ATCGTAATAG ATTATCAGAC CAACGAGGCA 
CTTAGGATAA GCGACCTTCA ATCCGGGAAG GCCCAAATAG CCCAGATAGA TATTATAGAC 
TTACCCCAGA TAATTGGCTC GCAGGGGATT TCCTACATAA GGACCCATAC ACATTATCCT 
ATCATGTATA ATGGAACCTA TGGGACAGTC TATGTTTGGG GACCATCCCC GCAGATTGAC 
TTCTTGGCAA TAGATGCTTA CCAGTATCCG TTCAACATCA CCAATGTGAG GCTTGCCATC 
GCGCATGCCA TAAATGCTAC GCAGATTCAA CAACAGGTCT ACGACGGATT AGCCCTAAGC 
TATGTTGGTC CCAATGATCC GTCCCTTCCC TTCTACAACT CCTCGATTCA AGGCTATACC 
TATGACCCCG CCCTTTCCAT AAATCTGCTG ACCCAAGCAG GATTTAGCTT AACCCTTCCC 
AACGGCACAA CGGTTAACCC AGGTGGAACG CCCTTCCCAA CCATAGTTTT GACCTACCAG 
ACAGGTAGCA CGGCACTTCA AGATGAGGCC CTCATTATAC AGCAGCAGTT AGCTCAGATA 
GGAATAAAGG TCCAGTTAAA CCCCGAGTCC ACAGTTACCA TTGTAGAGTC CTACCTCAAC 
CCACCCAATT CCAGCAGCTA TCCAGCCTTC CAGCTTGCAG CTAACTTCCC ACCTGTCCTC 
AGCCCCATTG ATCCTGCCAT CTACCTAATG TCTCAGGCGA GGCTTCACCA CGGCAATCCT 
GCTTTCGTCG ATAATCCAGA GATAAACTCT CTCATAATTC AAGCAGTGAG GACTGATAAT 
CCAGTTCAGC TCCAGAAAAT CTTCAATGAG ATAACAGAAC TCTCGCTACA GCAGGCCCAA 
TACGTATGGC TCGATGACTT CATCGCATAT ACAGTGACTG TCCATGGAAT TCAAGGAATA 
TATTACAGTC CAGGGTTTGA CGGATTGTTC TACGCAACAA TATACTAG

Protein sequence

MKLRKGISRT LVAGIIVVIV IIAAVAFISL SRHPTTTTPV NVTHTTNTTT TKTNVTVPTT 
NVTSIPSSIT VDEATPPVSV DPASSFDVAG GELLQNVYQT LVFYNGTNTS SFVGVLAENY 
TVLNNGTTYV FHLWPFITFS NGDPLNATDV WFSVYRTMLM NLGISVYVSQ GLSVNNGLGF 
VGKLPSGATG TIELPNGTLQ ALEYAGYTFP SNKTQAYEQA AYDLAYILSH FNVSNQTIQK 
VMSYPYQAVV VVNPYTVQFN LQYPYSAFLA AISTSAGAVV DPVFVDEHGG VQIDTANTYL 
STHALGSGPY MLETPLGQSY VILQANPNYW ASKVPQSERN FMLAIPKIET IVIDYQTNEA 
LRISDLQSGK AQIAQIDIID LPQIIGSQGI SYIRTHTHYP IMYNGTYGTV YVWGPSPQID 
FLAIDAYQYP FNITNVRLAI AHAINATQIQ QQVYDGLALS YVGPNDPSLP FYNSSIQGYT 
YDPALSINLL TQAGFSLTLP NGTTVNPGGT PFPTIVLTYQ TGSTALQDEA LIIQQQLAQI 
GIKVQLNPES TVTIVESYLN PPNSSSYPAF QLAANFPPVL SPIDPAIYLM SQARLHHGNP 
AFVDNPEINS LIIQAVRTDN PVQLQKIFNE ITELSLQQAQ YVWLDDFIAY TVTVHGIQGI 
YYSPGFDGLF YATIY