Gene Mpal_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1989
Symbol
ID	7270795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2113701
End bp	2115173
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	58%
IMG OID	643570604
Product	protein of unknown function DUF344
Protein accession	YP_002467015
Protein GI	219852583
COG category	[S] Function unknown
COG ID	[COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.210937
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGACC GATACGATCT CTCTAAGAAG GCGGATCAGA AAGAGTACGA CAAGACAGTC 
CCGGCACTGC AGGTGAGGTT CGGTGAACTG CAGCGGGAAC TGAGAACGGC GGGGATCCCG 
TTGATCCTGG TCGTCGAGGG GTGGAATGCT TCGGGGATCT CGGATGCGGT CAGCGAGTTG 
ATCCATGCCC TGGACCCACG TGGATTCACC TTTTATGCAA CCGGGAGTCC GAATGACGAG 
GAGAAGGCGC ATACCTTTCT CTGGCGGTTC TGGGTGAAGA CCCCGGCGAA AGGGAGGATC 
GCGATCTTCG CCCGGAGTTG GTACAGCCGG CTGCTCGCCG AGCGGATGGG CGGGATCAGC 
TGGAAAGAGA ATGAGAAGCA GTCCCTTCGG ACAATTCGGG CCTTTGAGCA GCAACAGGCT 
GACGACGGGA CGATTGTGCT GAAGTTCTTC CTGCACATCA GCAAGGAGGA GCAGAAGCGA 
AGGCTTGAGG AACGTGAAAG GGATCACCTG ACCTCCTGGA TGATCACCCG TGGGGACTGG 
GATTTTCACA ACCAGTATGA CCTGTATCTG CCTCTGATCG AGGATGTCAT CAAGGATACC 
GATAGCAAGG ACGCCCCCTG GACGATCGTT GAGGCGACGG ATCCCCGGTT TGCAGCCATC 
AGGGTCTACA CGGTCCTGAT CAAGACACTC GAGGCGCGGC TCTCTACCGC GAAGAAGGAA 
GAGAAGCAGA GCGATCACAA GAAAGACGAC CAGAAACGGT CCGGCTCGAT CCTCTCTCCG 
GTCGACCATT CCCTCTCCCT CTCCAAGCCG GAGTATCTTG AGCAGTTGAC GATCGTTCAG 
GGGCGGGTCC GCGAACGCCA GTATCAGATC TTCAAACGTG GGATACCGCT GATGATCGTG 
TACGAAGGCT GGGATGCCGC CGGTAAGGGG GGAAACATCC TCCGACTGAC GCAGAATCTG 
AATCCCCGCG GGTATTCGGT GGTGCCGGTA GCGGTGCCGA ACGATATTGA AAAGGCACAC 
CATTACCTCT GGCGGTTTTA CACCCACGCC CCGTCGGCCG GCTCGATCCG GATCTTTGAC 
CGTTCCTGGT ACGGCAGGGT GCTGGTCGAA CGAGTCGAGG GGTTCTGCAC TGACGAGGAG 
TGGGGGCGGG CGTATAACGA GATCAACCAG ATGGAGGAGG CGTTCCTCGC CAGCGGCGGC 
GGGCTTGTCA AGTTCTGGCT CGAGATCGAC AAGGACGAAC AGCTTCGTCG TTTCGAGCAG 
CGCCAGAACG ACCCTGCCAA GCAGTGGAAG ATCACCCCCG ATGACTGGCG TAACCGTGAA 
AAATGGGACC AGTATACGCT GGCCGTCGAC GAGATGCTGG CTAAGACCAG CACTAAGCAG 
GCGCCCTGGA CGATCATCGA GTCCGATGAC AAGTACTATG CACGGATCAA AGCACTCAAT 
ACGGTCGTCT CCTATATCGA CACCCTGCTC TGA

Protein sequence

MFDRYDLSKK ADQKEYDKTV PALQVRFGEL QRELRTAGIP LILVVEGWNA SGISDAVSEL 
IHALDPRGFT FYATGSPNDE EKAHTFLWRF WVKTPAKGRI AIFARSWYSR LLAERMGGIS 
WKENEKQSLR TIRAFEQQQA DDGTIVLKFF LHISKEEQKR RLEERERDHL TSWMITRGDW 
DFHNQYDLYL PLIEDVIKDT DSKDAPWTIV EATDPRFAAI RVYTVLIKTL EARLSTAKKE 
EKQSDHKKDD QKRSGSILSP VDHSLSLSKP EYLEQLTIVQ GRVRERQYQI FKRGIPLMIV 
YEGWDAAGKG GNILRLTQNL NPRGYSVVPV AVPNDIEKAH HYLWRFYTHA PSAGSIRIFD 
RSWYGRVLVE RVEGFCTDEE WGRAYNEINQ MEEAFLASGG GLVKFWLEID KDEQLRRFEQ 
RQNDPAKQWK ITPDDWRNRE KWDQYTLAVD EMLAKTSTKQ APWTIIESDD KYYARIKALN 
TVVSYIDTLL