Gene Mpal_0566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0566
Symbol
ID	7270150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	557543
End bp	558973
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	61%
IMG OID	643569212
Product	Aldehyde Dehydrogenase
Protein accession	YP_002465661
Protein GI	219851229
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.359165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.116957
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGG TGATCAATGG GGAGTGGGTC GGCTCGCTCT CAGACAGAAC GTATACGGTA 
AAGAATCCAG CGAATGGCGA GGCGGTCGGC CCAGCCCCGC TCGGAGTTCG GGATGATGTG 
AAGCGGGCGG CCGATGCCGC AGAGGAGGCG CTCTCCCGAT GGGGGGGCAC CTCCTCCCAC 
CATCGGGGGC AGATCCTCAC CAGGGCTGCA GCCAGGATCC GGGAACAGGC CGAGGAGATC 
GCGATAATTC TGACGGCGGA GCAGGGAAAA CCGCAGCGTG AGGCAATTGA TGAGATCCGG 
GGTACAGCCA GGGTCTTTGA ATACTATGCC GGCCTCTCGT CCAATCTCAC GGCCACGGTT 
CAGCATCTTG AGGACGGGTC CGAAGCGACG GTAATGCGGG AGCCGATCGG GGTCTGTGGG 
GCGATCATCC CCTGGAACAT GCCGGCGCTG TTGATGGCCT GGAAGGTCGG TCCGGCTCTT 
CTGACCGGGA ACACCGTCGT ACTCAAGCCG GCCACTGCAA CCCCGCTAAC CCCCCTGATG 
CTGGCTGCGG CTCTGCACGA TGTCGGGCTT CCCAACGGCG TTCTGAACGT GGTGACCGGT 
TCAGGCGACG AGGTAGGGGA GGAGATCGTC CGTTCCAAAC AAATTCAGAA GGTCTCGTTC 
ACCGGCTCGA CCCAGACCGG CAAGCGGATC ATGACACTGG CGGCCCATGA CCTCAAGAGG 
TTGACCCTCG AACTTGGGGG GAGTGATCCA ATGATCGTTT GTGGGGATGC TGATATCCCT 
AAGGCCGTCG CCGGAGCCGT CGCCGGCAGG TTCTATAATG CCGGACAGAT CTGCACCGCG 
GTGAAACGCC TCTATGTCGT CGACTCGGTC GCCGACCAGG TGATCGAACA GATTACCGAG 
AAGGTCGGCC AGATCACCAT CGGTGACGGA ATGAAGCCTG AGGTGAAGAT GGGACCGCTC 
TCCAGCCTGC AAGGGCGGGA GTCAATCCGC TCGGTCGTCA GGCAGGTGGT CGACCGGGAG 
GAAGGTCGAG TGATCGCCGG AGGGGAACTA CCACAGGGGG ATGAGTACAT CCGGGGGAAC 
TTCTATACCC CGACGCTGGT GACTGATGTC GTCCCGGATT CGATCCTGCT TCGAGAGGAG 
ATCTTTGGAC CGGTACTCCC GATTGTTCGG GTGAAGGATC TGAACGAAGC GATTACTGCC 
GCCAACAGCA CACGCTACGG GCTGGGTGCT TCGATCTGGA CCAGTGACCT AAAGACGATT 
CGGACTGCAG TCAGCGGGCT GAAGGCCGGT ATTATCTGGG TGAACCAGCA CCTGAAGATC 
CCACCGGAGG TGCCCTTCGG AGGCGTGAAG GAGAGTGGGG TCGGTCGGGA GAACGGTCTG 
CAGTCTCTGG ATGCCTACAC CGAGGCGAAG ACGGTGCTGG TCAGACTCTG A

Protein sequence

MKMVINGEWV GSLSDRTYTV KNPANGEAVG PAPLGVRDDV KRAADAAEEA LSRWGGTSSH 
HRGQILTRAA ARIREQAEEI AIILTAEQGK PQREAIDEIR GTARVFEYYA GLSSNLTATV 
QHLEDGSEAT VMREPIGVCG AIIPWNMPAL LMAWKVGPAL LTGNTVVLKP ATATPLTPLM 
LAAALHDVGL PNGVLNVVTG SGDEVGEEIV RSKQIQKVSF TGSTQTGKRI MTLAAHDLKR 
LTLELGGSDP MIVCGDADIP KAVAGAVAGR FYNAGQICTA VKRLYVVDSV ADQVIEQITE 
KVGQITIGDG MKPEVKMGPL SSLQGRESIR SVVRQVVDRE EGRVIAGGEL PQGDEYIRGN 
FYTPTLVTDV VPDSILLREE IFGPVLPIVR VKDLNEAITA ANSTRYGLGA SIWTSDLKTI 
RTAVSGLKAG IIWVNQHLKI PPEVPFGGVK ESGVGRENGL QSLDAYTEAK TVLVRL