Gene Mpal_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1040
Symbol
ID	7271774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1069002
End bp	1070654
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	56%
IMG OID	643569677
Product	DEAD/DEAH box helicase domain protein
Protein accession	YP_002466111
Protein GI	219851679
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAGGA GAAGAGGTAC TGTGAGCGAT ACAATAGAGA AGATATCCAA TACTGATACG 
CCGGCCGAAC CTGTTACCAA TGCATTCGAG GCACTGGGTA TCTCAAAAGA GATCCAGAGA 
GCCATCGTTG ATCTCGGGTT CGAAGAGCCG ACCCCCATCC AGCAGATGGC GATCCCCCTG 
ATTCATCAGG GATTTGATGT GATCGGCCAG GCCCAGACTG GGACTGGTAA AACGGCGGCT 
TTTGGAATAC CAACGCTAGA GAAGATTGAT CCCCTGGATA AACATGTCCA GGCTCTGATT 
CTCAGCCCAA CCCGTGAGTT GACCATCCAG ATCGCCGAGG AACTGAGCAA ACTGGCCCGT 
TACCGACGCG GGATCGCGAT CCTACCGATC TATGGCGGTC AGCCTATCGA GCGGCAGTTC 
GATGCTCTCA GACGGGGCGT TCAGGTCGTG ATCGGAACCC CAGGCAGGGT CATGGACCAT 
ATGCGTAGGG GAACGCTGGT CTTCGACCAC GTGAAGACCG TGGTCCTCGA CGAAGCGGAC 
GAGATGCTGG ATATGGGCTT CCGGGATGAT ATCGAACTGA TCCTCAAGAC GACGCCGTCA 
GACCGGCAGA CCACGCTCTT TTCAGCTACG ATGTCGCAGC CGATCCTGGA ACTGACCAAG 
CGGTTTCAGA AGAGCCCGAA GATGGTCAAG GTCACCCACA AGGAACTGAC GGTCGCGGCA 
GTTGAACAGA TCTACTACGA GGTTCGCGAA TCGCTGAAGC TCGAGGCGCT GGCCCGCCTG 
CTCGATATTT ACAATCCGAA ACTGACCCTG ATCTTCTGCA ACACCAAGCG GCGGGTCGAT 
GAACTGGTCG GACAGTTACA GGTCAGGGGA TATGCTGCGG AGGCTCTCCA TGGAGACCTA 
AAGCAGTCAC AGCGCGACCG GGTGATGGGC AGGTTCAGAT CCGGTGGGAT CGATATCCTG 
GTCGCGACCG ATGTCGCAGC CCGTGGGATC GATGTCGACG ATATCGAGGC GGTCTTCAAC 
TACGATATTC CGCAGGACGA GGAGTATTAT GTGCACCGGA TCGGCAGGAC CGGACGGGCC 
GGCAGGACCG GGCGTGCGTT CACCTTCGTC TCGGGTAAGG AGATCTGGAA AATCCGGGAT 
ATCCAGCGGT ACACCAACAC CCGCGTGATC CAGGCCCAGG TGCCGACCCT CTCGGATGTC 
GAGGAGATCC GGACCACACT CTTCATCGAC AAGGTGAAGA CGATCGTCGA TGCAGGTGGG 
CTTGAAAAGT ACGTCTCGAT GATCGAGAAA CTGATGCGTG ACGACTACGC TTCGCTTGAT 
ATCGCAGCAG CACTGCTGAA GATGCGGATG GAGCGTGATA CCAAGGAGGA GACCGCCGCC 
GAGCCGGACT TCAAGAATAC CGGTGCCGAG GCTGGCATGG TCAGGTTCTT CCTCAATGTC 
GGCAGAAACC ACAATGTCCG GGCGAAGGAT ATCCTCGGTG CGATCGCTGG CGAGACCGGG 
ATTCCTGGAA AGTCTATCGG TGCGATCAAC ATCTTTGACA GTTACTCGTT CGTCGAGGTG 
CCGCTTGAGC ACGCAAAGAC GGTCTACCAG ATCATGAACA AGAACCAGAT CAAAGGGAAT 
ACGATCAACA TCGAACCCGC AAACCAGCGG TAA

Protein sequence

MIRRRGTVSD TIEKISNTDT PAEPVTNAFE ALGISKEIQR AIVDLGFEEP TPIQQMAIPL 
IHQGFDVIGQ AQTGTGKTAA FGIPTLEKID PLDKHVQALI LSPTRELTIQ IAEELSKLAR 
YRRGIAILPI YGGQPIERQF DALRRGVQVV IGTPGRVMDH MRRGTLVFDH VKTVVLDEAD 
EMLDMGFRDD IELILKTTPS DRQTTLFSAT MSQPILELTK RFQKSPKMVK VTHKELTVAA 
VEQIYYEVRE SLKLEALARL LDIYNPKLTL IFCNTKRRVD ELVGQLQVRG YAAEALHGDL 
KQSQRDRVMG RFRSGGIDIL VATDVAARGI DVDDIEAVFN YDIPQDEEYY VHRIGRTGRA 
GRTGRAFTFV SGKEIWKIRD IQRYTNTRVI QAQVPTLSDV EEIRTTLFID KVKTIVDAGG 
LEKYVSMIEK LMRDDYASLD IAAALLKMRM ERDTKEETAA EPDFKNTGAE AGMVRFFLNV 
GRNHNVRAKD ILGAIAGETG IPGKSIGAIN IFDSYSFVEV PLEHAKTVYQ IMNKNQIKGN 
TINIEPANQR