Gene Amuc_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2106
Symbol
ID	6274754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2562143
End bp	2563453
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	58%
IMG OID	642614168
Product	Malate dehydrogenase (oxaloacetate-decarboxylating) (NADP(+))
Protein accession	YP_001878696
Protein GI	187736584
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCCG ATATTAGATT AGATGCCTTG CAGTACCATT CCCAGCCCCG CCCCGGCAAG 
GTGGAAACGC TGCCCTGCAA GCCCTGCTTT TCACAACGGG ATCTGACTCT TGCCTATTCC 
CCGGGCGTGG CCGAGCCCTG CCTCCGCATT AAAGAGGATC CTTCTCAAAG CGCCCTGTAC 
ACTGGTCGCT CCAATCTGGT GGGCGTAATC ACCAACGGCA CCGCCGTTCT GGGACTGGGC 
AATATCGGTC CGGATGCCTC CAAGCCGGTG ATGGAGGGCA AGGGCGTTCT GTTCAAGGTG 
TTCGCGGATA TTGACGTTTT TGACATTGAG CTGAACGTGA AGGAACCGGA AAAGCTGATT 
GAGACGATCA AGACCATGGA ACCCACTTTC GGCGCCATCA ATCTGGAGGA CATCAAGGCT 
CCGGAATGCT TCATGGTGGA AGAACGCCTG CGGGAGGAGA TGAATATTCC CGTGTTTCAT 
GACGACCAGC ATGGCACGGC CGTGATTTCC GGCGCCGCCC TGCTGAACGC CGCGGAGTTG 
ACGGGCCGCA AGCTGGAGGA TATGAAGGTT GTCGTCGTGG GGGCCGGCGC TGCCGGCATT 
TCCTGCGCCA AGTTCTACAT GACGTTAGGG GTGCGTCGCG AACATATCTA CATGTTTGAT 
TCCAAGGGGC TGATTCATAC CGGACGCATT GATCTTCATG CCACGAAAGC GCAGTTCTCC 
CAGTCGGAAG ACTGCTCCCT GGAGGAGGCC CTTACCGGAG CGGACGTGTT CCTGGGGCTG 
TCCACCAAGG GACTGCTCAC GCAGGACATG GTGAAGCTCA TGGCTCCTTC CCCCATCATT 
TTCGCCTGTG CGAATCCGGA CCCGGAAATT ACGTATCAGG ATGCTAAAAA AGCGCGGCCT 
GACTGCATTA TGGGGTCCGG CCGTTCCGAC TGGCCCAACC AGGTGAACAA TGTTTCCTGT 
TTCCCCTTTA TTTTCCGTGC CGCCCTGGAT GTGCGCGCTT CCGTCATCAA TGAACAGATG 
AAGATTGCCG CCGCCCGCGC CCTGGCCGAT CTGGCGAAGG AGCCCGTCCC CCAGGAAGTG 
ATTGACCTTT ACGGGGGAGC CCCGCTCAGC TTCGGCATCG ACTACGTGAT TCCCAAGCCC 
ATTGATCCCC GCATTATTGA ATGGGAGTGC CCGGCGGTAG CCCAGGCGGC CATGATTTCC 
GGGGTGGCCC AGTCCCCCAT CCGGGATATG GAAGCCTACA CGCTGGAATT GCGCAAGCGC 
ATTGCCGCGG CTCGTGAACG CGTCTCCGGC GTGGTGCGCA GCTATCTTTA A

Protein sequence

MSSDIRLDAL QYHSQPRPGK VETLPCKPCF SQRDLTLAYS PGVAEPCLRI KEDPSQSALY 
TGRSNLVGVI TNGTAVLGLG NIGPDASKPV MEGKGVLFKV FADIDVFDIE LNVKEPEKLI 
ETIKTMEPTF GAINLEDIKA PECFMVEERL REEMNIPVFH DDQHGTAVIS GAALLNAAEL 
TGRKLEDMKV VVVGAGAAGI SCAKFYMTLG VRREHIYMFD SKGLIHTGRI DLHATKAQFS 
QSEDCSLEEA LTGADVFLGL STKGLLTQDM VKLMAPSPII FACANPDPEI TYQDAKKARP 
DCIMGSGRSD WPNQVNNVSC FPFIFRAALD VRASVINEQM KIAAARALAD LAKEPVPQEV 
IDLYGGAPLS FGIDYVIPKP IDPRIIEWEC PAVAQAAMIS GVAQSPIRDM EAYTLELRKR 
IAAARERVSG VVRSYL