Gene Msed_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1049
Symbol
ID	5104431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	977618
End bp	978610
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	47%
IMG OID	640506945
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001191138
Protein GI	146303822
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.933184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAAG AGCTAACGCT TAGGGTAGAG AACCTTTGGG TGTCCTATTA CCTAGAGGGA 
AGGGAGGCCT TCGCAGTGAG GGATGTTTAC CTAGACGTAG GGAAGGGAGA GGTAGTGGGA 
ATAGTGGGAG AGAGCGGTTC AGGAAAGAGC ACCCTAGCTC ATGCCATCAT AGGCTTACTT 
CCCAGGAATT CAAGGATATC TAAGGGAAGA ATTCTGTTTA AGGGAAAGGA TATTACAGGA 
ATTAAGACGG ACCAAAGATA TCTCTACAGG GGTACAAACA TCTTCATGAT ATTTCAGGAT 
CCAATGTCAA GCCTTAATCC CACAATGAAG ATTCGCGACC AGTTACAGGA AGCAATAGAC 
GTGAGGTTGG GAAAAAGGGG ATGGAATATT GGAACGTGGA GACCTCCAAA GGGGAATAAC 
GAAGAGGAGA TCGTGGATTC GTTGGAAAGG GTAGGGATAA AGAGGCCTAG GGTCATAATG 
GAGAAGTATC CTCATCAACT TTCAGGTGGG GAGAGGCAGA GGGTCATGAT TGCCATGGCC 
TACCTCTTAA AACCTTCCCT CCTCATTGCG GACGAACCAA CCACTGCGTT AGATATGATA 
ACCCAAGCAC AGGTAATGAG GCTAATCACG GAGTTGAGGG AGAGTCTGGG ACTTTCTGTT 
CTCTTTATAA GTCACGACAT AGTCCTTGTG GGGCAGATAG CCGATAGAAT AGTGGTAATG 
TATGCGGGGA AAGCTGTGGA GGAGGGTAAA GCTGAGGAGA TAGTCGAGTC CCCCATGCAC 
CCCTACACTA AGGGTCTAAT TAACTCGATC CCAGATGGCT ACAAGAACGA GAAAAGAATT 
GAGTCAATTC CTGGATCTCC ACCCAATATT CTTAAACTGC CTCCAGGTTG TTCCTTTAAT 
CCAAGGTGCA AGTTTGCCAT GGAGAAGTGC ATGTCAGAGG ATCCGGAAAC TAGAGTTTTA 
GGAGGGAGAA AGGTTGCTTG CCACCTATAC TAA

Protein sequence

MSEELTLRVE NLWVSYYLEG REAFAVRDVY LDVGKGEVVG IVGESGSGKS TLAHAIIGLL 
PRNSRISKGR ILFKGKDITG IKTDQRYLYR GTNIFMIFQD PMSSLNPTMK IRDQLQEAID 
VRLGKRGWNI GTWRPPKGNN EEEIVDSLER VGIKRPRVIM EKYPHQLSGG ERQRVMIAMA 
YLLKPSLLIA DEPTTALDMI TQAQVMRLIT ELRESLGLSV LFISHDIVLV GQIADRIVVM 
YAGKAVEEGK AEEIVESPMH PYTKGLINSI PDGYKNEKRI ESIPGSPPNI LKLPPGCSFN 
PRCKFAMEKC MSEDPETRVL GGRKVACHLY