Gene Amuc_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0233
Symbol	tdh
ID	6275290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	291556
End bp	292593
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	54%
IMG OID	642612281
Product	L-threonine 3-dehydrogenase
Protein accession	YP_001876857
Protein GI	187734745
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR00692] L-threonine 3-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.43371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGGCA TGAAAGCTCT TGTAAAAACG CAGGCTGGCC CCGGTTTGGA ATTGATGGAT 
GTTCCTATGC CGGAAGTCGG CCCGAATGAC GTCCTGATCA AAATTCATAA AACAGCCATT 
TGCGGCACGG ATCTTCATAT TTGGAATTGG GATAAATGGG CCCAGCAGAC CATTCCGGTA 
GGGATGCATG TGGGCCATGA GTTCTGCGGC GTGATTGAGT CCGTAGGTTC TTCCGTGACG 
GAATACAAGC CCGGGGAGAT TGTTTCCGGT GAGGGGCATA TTGTCTGCGG CCATTGCCGC 
AGCTGCCGTT CAGGGCAGAA GCACTTGTGC CCCAACACAA AGGGTGTGGG AGTCAACAGG 
CCCGGCTGCT TTGCGGAGTA CCTTTCCATT CCGCAGGATA ACGTGGTGCG CATCCACAAG 
AGCATTCCGA TGGAAATCGC CTCCATTTTT GACCCGCTGG GCAACGCCGT CCATACGGCT 
TTGTCCTGGG ATCTGGTGGG CGAGGACGTA CTGATTACGG GAGCCGGGGT TATCGGCTGC 
ATGGCTGCCG CCGTCTGCAA GAAGGCCGGA GCCAAGACGG TGGTTATTAC GGACATCAAT 
GATTTCCGCC TGGGTCTTGC CAAAACGCTG GGGGCGGACC GAACCGTGAA CGTGACCCGT 
GAAAAGCTGG AAGACGTGAT GAAGGAACTG GAAATGACGG AGGGATTTGA CGTGTGCCTG 
GAAATGAGCG GCGCTCCGTC CTGCCTGAAG GACATCATCG ACAATTCCCG CAACGGAGCC 
AACATTTCCC TGCTGGGGAT TCAGCCCGAT GGTTCCAGCA TCGAGTGGAA TAAGTTCATT 
TGGAAAGGGT TGAAGATGAA AGGCATTTAT GGCCGTGAAA TTTTTGAAAC TTGGCATAAA 
ATGGATTCCA TGATCCGCAG TGGCTTGAAT GTGGCGCCCA TCATCACGCA CCGTCTGCCC 
TACACGGAAT TCCGGGAAGG GTTTGAAGCC ATGAATTCGG GAAAATCCGG CAAGGTTGTT 
CTGGACTGGA TTGTTTGA

Protein sequence

MGGMKALVKT QAGPGLELMD VPMPEVGPND VLIKIHKTAI CGTDLHIWNW DKWAQQTIPV 
GMHVGHEFCG VIESVGSSVT EYKPGEIVSG EGHIVCGHCR SCRSGQKHLC PNTKGVGVNR 
PGCFAEYLSI PQDNVVRIHK SIPMEIASIF DPLGNAVHTA LSWDLVGEDV LITGAGVIGC 
MAAAVCKKAG AKTVVITDIN DFRLGLAKTL GADRTVNVTR EKLEDVMKEL EMTEGFDVCL 
EMSGAPSCLK DIIDNSRNGA NISLLGIQPD GSSIEWNKFI WKGLKMKGIY GREIFETWHK 
MDSMIRSGLN VAPIITHRLP YTEFREGFEA MNSGKSGKVV LDWIV