Gene Amuc_1911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1911
Symbol
ID	6275390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2317939
End bp	2319099
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	56%
IMG OID	642613972
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001878506
Protein GI	187736394
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.0885736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCAGC CATTTCAATT TTTCATGCCC GCGCAAATCT TTTTTGGCGC GGGTTCTTTG 
GACAATCTTG GTTCCGCTCC CCTGCCCGGC ACCAAGGCCC TGATCGTCAT CGGCGGGTCG 
TCCGTCAAAC GCCTCGGGTA TCTGGACCGC GTACAGGCTC TTCTGAAAAA ACAGGGAGTG 
GAAAGCGTTG TTTTCGATAA AGTGCAGCCC AACCCCGTGG TGGAGCACGT AATGGAAGCC 
TCCTCCCTGG CCAGGGAAAC GGGCTGTGAT TTCGTCATCG GCCTGGGCGG GGGCAGCAGC 
ATGGATTCCG CCAAGAGCAT CGCCGTGATG GCGGCCAATC CAGGAACCTA CTGGGATTAC 
ATCCAGGGAG GTTCCGGCAA GGGGCTTCCC ATTCCCTGCA AACCTCTTCC CATCGTCTGC 
ATCACCACTA CGGCGGGAAC CGGAACGGAG GCGGATCCGT GGACCGTCAT CACGAAAGAG 
GACACGCAGG AGAAGATCGG TTTCGGGTTC AAGGGTACTT TCCCCACCAT GTCTATCGTA 
GATCCGGAGT TGATGCTTTC CGTACCTCCC AAATTAACGG CATACCAGGG GTTTGACGCT 
TTGTTCCATG CCGTGGAGGG ATATATGGCT ACAATCGCCT CCCCCATGGG GGACATGTTC 
GCGCTCCAGG CTATTGAATA CATTGCCAAA TATCTTCCGC GCGCCGTAAA TAACGGGGAT 
GATCTGGAAG CGCGCGCCTA TGTGGCGCTG GCCAATACCT ATTCCGGGTT TGTGGAAACC 
ATTTCCTGCT GTACGTCGGA ACATTCCATT GAACATGCCC TCAGCGCCTT CCATCCTTCC 
CTGCCCCATG GCGCGGGGCT AATTATGATT TCCTGGGCCT ACCATGAAGC CTATGCTCCC 
TCCTGCCCGG AACGTTACGC AAGAGTTGCC GCAGCCATGG GACAGGAAGC CTCCGTGGAC 
GGTTTCCTGA ACGGCTTGAA CAGCCTGAAG GAAGCCTGCG GCGTAGACAA GCTGAAGATG 
TCCGAATTCG GCATTACACC GGATTTATTT GACGAATACG CCAAAACGGC TTTTTCCACC 
ATGGGCAATC TGTTTGAGCT GGACCGTTGC AAGTTGACTC CGGCGGACGT GGTCAGCATC 
CTGGAGAAAT CCTATTCCTA G

Protein sequence

MYQPFQFFMP AQIFFGAGSL DNLGSAPLPG TKALIVIGGS SVKRLGYLDR VQALLKKQGV 
ESVVFDKVQP NPVVEHVMEA SSLARETGCD FVIGLGGGSS MDSAKSIAVM AANPGTYWDY 
IQGGSGKGLP IPCKPLPIVC ITTTAGTGTE ADPWTVITKE DTQEKIGFGF KGTFPTMSIV 
DPELMLSVPP KLTAYQGFDA LFHAVEGYMA TIASPMGDMF ALQAIEYIAK YLPRAVNNGD 
DLEARAYVAL ANTYSGFVET ISCCTSEHSI EHALSAFHPS LPHGAGLIMI SWAYHEAYAP 
SCPERYARVA AAMGQEASVD GFLNGLNSLK EACGVDKLKM SEFGITPDLF DEYAKTAFST 
MGNLFELDRC KLTPADVVSI LEKSYS