Gene Amuc_2116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2116
Symbol
ID	6275476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2578670
End bp	2579791
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	58%
IMG OID	642614178
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_001878706
Protein GI	187736594
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.00796302
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAACAAA CCGCACGCGC CGCTGTCCTG ACAGCACCAA AGACATTTGA AATCCGTGAA 
TATCCCATTC CCGCCATCGG AGACGATGAA ATGCTGATCA AGGTGGAAGC CTGCGGCGTT 
TGCGGAACGG ACGGCCACGA ATACAACCGG GACCCCTTCG GCCTCTGCCC CGTGGTCCTG 
GGCCATGAAG GCACCGGGGA AATCGTCGCC ATGGGCAGGA ATATCACTAA AGACACCGCC 
GGAAATCCCG TAGCGCTGGG GGACAAGATC GTCACCTGCA TCATTCCCTG CGGCACCTGT 
GACGCCTGCC TGAATACTCC GGCCCGCACC AACCTGTGCG AAAATGTGGG CGTGTATGGC 
CTGATGCCTG ACGACGACGT GCATCTGAAC GGCTACTTCG GGGAGTACCT CGTCATCCGC 
AAGGGCTCCA CATTTTTCAA TGTTTCCGGC ATGACGCTGG ACCAGCGCAT TCTGGTGGAA 
CCCGCCGCAG TGGTGGTCCA TTCCCTGGAA CGCGCCAAGT CCACCGGGCT CCTCAAGTTC 
AATTCTGTGG TTCTCGTGCA GGGCTGCGGC CCCATCGGCC TTCTTCAAAT CGCCACGCTG 
CGCACGCTGG GCATTGAAAC CATCATCGCT GTGGACGGCA ATGACTCCCG CCTGGAACTG 
GCCAGGGAAA TGGGAGCCTC CCGCACGTAT AACTTCACCC GGTACGCGGA TCTGAACGAA 
CTGCTGGATG CCGTGAAAAA GGACAACGGC GGCCGCCTGG CGGACTTCGT CTTTCAGTGC 
ACGGGCGTAG GCAAGGCCGG GGCCAACGCC TGGAAGTTCG TGAAGCGCGG CGGCGGCCTG 
TGCGAAGTGG GCTTTTTCAT GGATGGAGGG GAAAGCGTTA TCAACCACCA TTACGACCTC 
TGCAACAAGG AGGTAACCGC CGTAGGCTCC TGGGTGTACT CCCCGCAGGA CTACCCGACC 
ACATTCGACT TTCTGAAGCG AGCCTACGGC ATCGGCCTGC CGCTGACCAA GCTGATCTCC 
CACCGCTTCA AGCTGGATGA AATCGCGGAA GCCCTGGAAA CCAACGTCCA GATGAAAGGC 
ATCAAGATTG CCGTCATTTG TAATTGCAGT AAAAATATAT AA

Protein sequence

MQQTARAAVL TAPKTFEIRE YPIPAIGDDE MLIKVEACGV CGTDGHEYNR DPFGLCPVVL 
GHEGTGEIVA MGRNITKDTA GNPVALGDKI VTCIIPCGTC DACLNTPART NLCENVGVYG 
LMPDDDVHLN GYFGEYLVIR KGSTFFNVSG MTLDQRILVE PAAVVVHSLE RAKSTGLLKF 
NSVVLVQGCG PIGLLQIATL RTLGIETIIA VDGNDSRLEL AREMGASRTY NFTRYADLNE 
LLDAVKKDNG GRLADFVFQC TGVGKAGANA WKFVKRGGGL CEVGFFMDGG ESVINHHYDL 
CNKEVTAVGS WVYSPQDYPT TFDFLKRAYG IGLPLTKLIS HRFKLDEIAE ALETNVQMKG 
IKIAVICNCS KNI