Gene Amuc_0744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0744
Symbol
ID	6275534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	879379
End bp	880446
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	57%
IMG OID	642612795
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001877361
Protein GI	187735249
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.819882
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTGGT TCAAAACAGA CGACATACGC ATTCAAGACA TTGAGCCCCT GATTTCCCCC 
GCCATTTTAA TCAAGGATTA TCCGGCAACC ACCGAAATCG CCAAAATGGT GGCTACGACC 
CGCAAGAATG CGGAGAACAT CATTTCCGGC CACGACGACC GCCTGCTGGT GGTGGTGGGG 
CCATGCTCCA TCCATGATCC CCAGGCTGCC GTGGACTATG CCTCCCGCCT GAAGGAACAA 
ATGGCGCGCT TTGAAAAGGA TCTGGTGATC ATCATGCGCG TGTATTTTGA AAAGCCCCGC 
ACCACCGTTG GCTGGAAGGG CCTCATCAAC GACCCGTTCA TGAACCATAC CTTTGACATC 
AACCGCGGCC TCCATATGGC CCGCGGGCTG CTGCTGCGCC TGGGGGATAT GGGAGTGCCC 
GCAGCTACCG AGTTCCTGGA CACCATCACG CCGCAGTACA TTGCGGACCT GATCACGTGG 
GGCGCCATCG GCGCGCGCAC CACGGAAAGC CAGGTACACC GTGAACTGGC TTCCGGGCTT 
TCCATGCCTG TGGGATTCAA GAATGGCACC AGCGGCAGCC TGCAAATCGC TGTAGACGCC 
ATTGTTTCCT CCTCCTGTCC GCACTGCTTC CTTTCCGTGA CCAAGCAGGG AGTTTCCGCC 
ATTGTTTCCA CTACGGGCAA TAAATCCTGC CACCTGATCC TGCGCGGTTC CTCCCTGGGG 
CCGAACTTTG ATGAAGATCA TGTAAAAGAA GCGGAAGAAG CCTTGCAGAA GGCCGGCATC 
AACAACCGCA TCATGATAGA CTGTTCCCAC GGAAACAGTT GCAAGGATTA TCGCAAACAG 
CCGGCTGTGG CCGCCAATAT CGCGGAACAG ATATCCAGCG GGTCCGAACA GGTTGTTGCC 
GTGATGATTG AAAGCAACAT TGTGGAAGGG GCCCAGCCGT TGAGTTCCGA CCTGGTGTAC 
GGCAAGAGCA TCACGGACCA GTGCATTGGG TGGGAGACGA CAGTGGAAGT GCTGGAAACC 
CTTGCCGCCG CTGTCCGCAA ACGCCGTGCC AAACGGCAGG AAGCGTAA

Protein sequence

MNWFKTDDIR IQDIEPLISP AILIKDYPAT TEIAKMVATT RKNAENIISG HDDRLLVVVG 
PCSIHDPQAA VDYASRLKEQ MARFEKDLVI IMRVYFEKPR TTVGWKGLIN DPFMNHTFDI 
NRGLHMARGL LLRLGDMGVP AATEFLDTIT PQYIADLITW GAIGARTTES QVHRELASGL 
SMPVGFKNGT SGSLQIAVDA IVSSSCPHCF LSVTKQGVSA IVSTTGNKSC HLILRGSSLG 
PNFDEDHVKE AEEALQKAGI NNRIMIDCSH GNSCKDYRKQ PAVAANIAEQ ISSGSEQVVA 
VMIESNIVEG AQPLSSDLVY GKSITDQCIG WETTVEVLET LAAAVRKRRA KRQEA