Gene Msed_1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1051
Symbol
ID	5104433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	979520
End bp	980815
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	48%
IMG OID	640506947
Product	ATPase
Protein accession	YP_001191140
Protein GI	146303824
COG category	[R] General function prediction only
COG ID	[COG1672] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.709814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATATTCA TGAATATGAT ATTCGTGGAT AGGGAGAAAG AGCTTCAGAC CTTGATGCAG 
AGACTAAATT CCCCTACCTT CGAGCTCGTG ATCGTCTACG GAAGGAGAAG AATAGGAAAG 
ACCTCCTTGA TATTGAGGGC AATCTCTGGG AGAAACGACT CCGTATATTA TTATGCCACG 
GAGAGGAACA ATTTGGAAAG ATTTAGGGAG GTAGCTCAAA GGAAGTTCCC GGAGGTGAGA 
TATGCTAGGG AGGATTGGGA ATCCCTCCTC CACTTCCTGA GAGACAAGGT CGTGATCATA 
GACGAGTTTC CCTACCTGAT TGAAGAGGAT AAGTCGATCT TGTCCACATT TCAGAGAATA 
GTGGACGAGA ACAGGGATAG CAGAACCAAG TTGATACTTT TGGGCTCATC AATCTCCGTC 
ATGGAGGACG TCCTTTCCTA CAGGAGTCCG CTTTACGGGA GGAGAACTGC CTCACTCAAG 
GTAGGGGAGC TCAAGTTCAG GGACCTACGT CATTTAGGGT TCAGCGTAGA GGAAGCGGTG 
AAAATTTACG GATTTGCGGG AGGTGTTCCC ATGTACTTGA CCAGGGTTAC TCCTCCCTTT 
CTGGATTGGG TCAACCGTGA GCTCAAGAGA GTTGACTCGT TCCTGAGGGA CGAGGTTGAT 
TTCCTGCTTA GGTATGAGTT TAGGGAAATA GGGACTTACA AGGAGATTTT AAGGGCAATT 
TCCATGGGAA AGAACACCCT CGCAGAGATT AGGGATTACG TGAAGGTGGG AGGTGAAATA 
AGCTCTTACA TCAAGAAACT TGAGAGGATT GAGCTAGTAA CAAGGGAAGT TCCAGTTACC 
GAGAGCGTCA GGTCCAAGAT GGGAAGGTAT GTGATAAGGG ATAACTTCAC CAACTTCTGG 
TTTAGGTTCG TTTACCCCAA TCTAAGCCTT ATAGAGGAAG GGACGTACGA AATAACTGAA 
GGGGAGTACG CGAACTACCT TGGCCACGTG TTTGAGAGGA TTTGCAGGGA GTATGTGAGA 
GACAGATATC GCGTTAAGAA AGTGGGCAGA CAGTGGTGGA AGGACGTGGA AATTGACGTC 
ATGGGATTAG GGAATGTTAA GGTTGCAGGG GAATGTAAGT GGAGCGAGGA TGTGAATCCC 
CACAGCGTCC TCGCCAACCT GGAGAGGAAA GTTGAGAGGC TAGGTCATAC CGTGGATCGT 
TACGTGGTGT TTGCGAGGTC CTTCTCCACG AAGGAGAAGA TGGAAAAAGC GGAACTCGTG 
GACATCAACG ACCTCAACTC CTGGTTCATG AGTTAA

Protein sequence

MIFMNMIFVD REKELQTLMQ RLNSPTFELV IVYGRRRIGK TSLILRAISG RNDSVYYYAT 
ERNNLERFRE VAQRKFPEVR YAREDWESLL HFLRDKVVII DEFPYLIEED KSILSTFQRI 
VDENRDSRTK LILLGSSISV MEDVLSYRSP LYGRRTASLK VGELKFRDLR HLGFSVEEAV 
KIYGFAGGVP MYLTRVTPPF LDWVNRELKR VDSFLRDEVD FLLRYEFREI GTYKEILRAI 
SMGKNTLAEI RDYVKVGGEI SSYIKKLERI ELVTREVPVT ESVRSKMGRY VIRDNFTNFW 
FRFVYPNLSL IEEGTYEITE GEYANYLGHV FERICREYVR DRYRVKKVGR QWWKDVEIDV 
MGLGNVKVAG ECKWSEDVNP HSVLANLERK VERLGHTVDR YVVFARSFST KEKMEKAELV 
DINDLNSWFM S