Gene Msed_1172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1172
Symbol
ID	5104468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1139792
End bp	1140916
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	54%
IMG OID	640507064
Product	ATPase
Protein accession	YP_001191257
Protein GI	146303941
COG category	[R] General function prediction only
COG ID	[COG1672] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0968898
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGTGT ACGGAGTTCC CACCACCAAC CCTTTCGGTA GGGAGAGGGA GATTAGGATC 
GTGAGCAACT TCCTGAGGAG TGGTCAACCC GTGGGGCTAA TGGGAGTTAG AAGGGTTGGT 
AAAACGTCGC TCCTCCTGGC TTCCCTGCGT CAAGCTTCCT TGCCCTACAT TTACCTCTCC 
GCCGAGGAGT TCACCTCCGG GAAGTCCTTC GATTTCCACT CCTTCATCTC GGGTTACGTG 
GTCTCCGTGA CCTCAACCCT TTACTCGCTG GCAGGCTACA GGGTGTTAAC GGAGAAGGGT 
AGATCATGGC TGAGGCAACT GAGGGACCTC GTGGGGGCAA TCAAGGTGAC TTTCAACATA 
CCAGAGGTCT CAGCGACGCT CGACGTTACC CTGGAAAAGG TTGAGAGGAG GAAGAGGTTA 
GAGGAGGAAC TCCCCAGGAT TGTGGACTTG CCACAGATCA TGGCTGAGAA GTTTGGAGTG 
CCCAGGGTTG TGATAGCGGT CGACGAGTTT CAGTACTTGA ACTTGGCAAA GCAGTCAATG 
CCCAACATCT TCCACGTTTT AAGGAGTAGG TGGCAGTTCC ACACCAGGGT TTCCTACGTT 
ATATCCGGTT CGCTCATTGG AATGATGAAC GAGTTGCTCA ATTCCAGGGA TCAGCCCTTC 
TACCAATTTT TCTACTTGAT GAAGGTGGGA CCTCTGCCCC CTGACGTTAG CAGGGATTTC 
CTGAGGAGGG GTTTCGAGCA CTACGGAGTT CGAGTTGGGG AGGAGGAAAT TGATAGGGTG 
GTGGACTACG TTGACGGTTT ACCAGCGTGG TTGAACCTTG TGGGTCTCAA GGTCGTGAGT 
GAGGGGAAGA GCGTGAACCA GGTGCTCGAC ACGCTTACGC AGGACATCAA CGTGGTCAAT 
GCGATCGAGG GAGACTTGAG GAAGCTGTCC CCAGGGGCCA GGAGCGTTCT CAAGAGGTTG 
GCGATGCTAG GTGGTCAGGG AAGGCCCAGG GACCTAGGGG ACGATAGGTG GGGGGTCGTG 
AGGGCCCTAC AGCAACTCAT ACGCTACGGA ATCGTTGAGA GAGAGGATGA GGGAAACTAC 
AGAATAGTAG ACCCTCTGCT TGTCCATTAC TTGAGAGGCA ATTAG

Protein sequence

MFVYGVPTTN PFGREREIRI VSNFLRSGQP VGLMGVRRVG KTSLLLASLR QASLPYIYLS 
AEEFTSGKSF DFHSFISGYV VSVTSTLYSL AGYRVLTEKG RSWLRQLRDL VGAIKVTFNI 
PEVSATLDVT LEKVERRKRL EEELPRIVDL PQIMAEKFGV PRVVIAVDEF QYLNLAKQSM 
PNIFHVLRSR WQFHTRVSYV ISGSLIGMMN ELLNSRDQPF YQFFYLMKVG PLPPDVSRDF 
LRRGFEHYGV RVGEEEIDRV VDYVDGLPAW LNLVGLKVVS EGKSVNQVLD TLTQDINVVN 
AIEGDLRKLS PGARSVLKRL AMLGGQGRPR DLGDDRWGVV RALQQLIRYG IVEREDEGNY 
RIVDPLLVHY LRGN