Gene Amuc_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1646
Symbol
ID	6274630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1989053
End bp	1990252
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	54%
IMG OID	642613706
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_001878247
Protein GI	187736135
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.182674
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAGG ACTCAACCCG CAAAGCCAGA GTGAATGTGA GACGGGCCGA AGTAATGGAG 
CAGGTGGAAA AGGAAATCCA GCAGCATTAC CAGAGTGAAT TGATTTCCCA CATCCGTTCT 
GCGGGCAATG TGTACAATCT GGGCCATACG GAATTTTTTC TCGCCCGGGA GTTCGGGTTC 
TGCAACGGCG TGCGCCGTGC TATTGATATA GCATATGCGG CACGCAGAGT GTTTCCTGAC 
CGGCGGATTT TTCTGATTGG GGACATTATT CACAATCCGG AAGTGAACCG GCAGCTGGAG 
GAAATGGGCA TTCGAAAACT TCCCTGGAAG CAGTTGGATT CCTCCTATGA CCGGGTTGCT 
CCGGACGATG TGGTGATTAT TCCCGCGTTC GGTGTTCCCA CTCCTTTCAT GGATGCGCTG 
GAGGAGAAGG GCGTGCAGAT TGTGGATACG ACATGCGGGG ACGTGATGAA GGTCTGGAAA 
AGAGTGAAGA ATTACGCCGC CATGGGGATT ACCTCCATTA TCCACGGTAA GGCTACCCAT 
GAGGAAACCA GCGCTACGGC TTCCCGGGCT CTTGGGGAAC GGGGAAGGGG GAAATACCTG 
GTGGTTTACG ATTTGGAGGA TGCCCGTATC CTGTGCGACT ACATCATGGG CCGCGGAGAC 
CGCGAGGCAT TCCTGAAACG GTTTGAAGGA TGCTGTTCCC CGGGATTCGA TCCCGACCGG 
GATCTGGAGG AGGTTGGCAT CGCCAACCAG ACCACCATGT TGAAAACGGA GACGCAGACG 
CTCCAGAAGA TGGTGAAGGA TGCCATTGTT CAGAGGGATG GGGACGATGA TAATTTTTAT 
GTGTTTGACA CCATTTGCGG TGCTACCCAG GATCGCCAGG ATGCCCTGTA TGAACTGCTT 
AAAAATCCTC TGGACGTCAT GTTTGTGGTG GGTGGCTACA ACAGTTCCAA CACAACGCAT 
CTGGTGGATA TTGCCAGGGA GCATGTGCCC ACGTACTTCA TTGAGTCCGC AGAATGCATC 
AAGTCCATCC AGTATGTGGA TGCTTTTGAT ACGAAGACGC GGGAAGTGCG CCGCATGACT 
ACGGAACCGG TAGTGCAGAA TCTGGGCAAA TCCCTGAAGG TGGGAATTAC GGCGGGCGCC 
TCATGTCCGG CCAACCTGAT TGAGGCCACC ATCCTCCGCA TTGCGGATCT GCGCAAGTAG

Protein sequence

MNQDSTRKAR VNVRRAEVME QVEKEIQQHY QSELISHIRS AGNVYNLGHT EFFLAREFGF 
CNGVRRAIDI AYAARRVFPD RRIFLIGDII HNPEVNRQLE EMGIRKLPWK QLDSSYDRVA 
PDDVVIIPAF GVPTPFMDAL EEKGVQIVDT TCGDVMKVWK RVKNYAAMGI TSIIHGKATH 
EETSATASRA LGERGRGKYL VVYDLEDARI LCDYIMGRGD REAFLKRFEG CCSPGFDPDR 
DLEEVGIANQ TTMLKTETQT LQKMVKDAIV QRDGDDDNFY VFDTICGATQ DRQDALYELL 
KNPLDVMFVV GGYNSSNTTH LVDIAREHVP TYFIESAECI KSIQYVDAFD TKTREVRRMT 
TEPVVQNLGK SLKVGITAGA SCPANLIEAT ILRIADLRK