Gene Amuc_1614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1614
Symbol
ID	6275404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1939768
End bp	1941012
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	56%
IMG OID	642613674
Product	NADH dehydrogenase I, D subunit
Protein accession	YP_001878215
Protein GI	187736103
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGA GCACCAAAAC TTTCGCCATT GCAGATACAG CCGCTAACGC AGACTATCTC 
ACCAATACAT CCGAACCGCT CGGAGAAACG ATGACCCTGA ATGTGGGCCC CTCCCACCCC 
GCCACCCACG GCGTGCTGCG CCTAGTGCTG GAACTTGATG GTGAAGAAAT CATCAGCTGT 
GATCCGGTGG TTGGCCATCT GCACCGCGGA ATGGAAAAAA TAGGCGAAAC CATCCAGTAC 
AACCAATTTG TTCCCTACAC CGACCGTTTT GACTACCTGG CCCCCCTGTC CAACAACATC 
GCCTATGCCT GCGCGGTGGA AAAACTGCTG GGATGGGAAC TGCCGCCCCG CGGACAGGCC 
CTGCGCGTAC TGGCCCTGGA ACTTTCCCGC TTTTCCTCCC ACATCCTGGG CGTAGGCGTG 
TACGGCATGG ACGTAGGCGC CATGACCGTT TTCCTGTACT GTTATGAGGA ACGTGAAAAA 
ATCCATAATT TTTACGAACA GCTCACTGGG GCGCGCTTTA CTTCCTCCTA TACCCGCATC 
GGCGGACAGA CGCGTGATGT TCCCAATGAA ATGCTCAAGG AAGTGCTCGT CTTCTGCGAT 
GAAGCGGCCA AAACCCTTGA TGAAACGGAA GCCCTCCTGC TCAAAAACAA AATCTTCATT 
GACCGTCTTC AGGGCGTAGG CGTCATCAGC CGTGAAAAAG CGCTTTCCTG GGGTATTACG 
GGGGCCAACC TGCGAGCCAG CGGCATTAAG CGGGACCTGC GCAAACTCAC CCCCTATCTG 
GGATATGAAA ATTACGAATT CGACGTCCCC GTAGGCGAAC ACGGAGACTG CTACGACCGT 
TTTACCGTGC GCATTGAAGA AATGCGCCAG TCCCTGCGCA TCATCCGCCA AGTCATTGAA 
ACCATGCCGG ACGGCCCCAT CAACATGGTG GACACCAAAG GCACGCTGCC TGAAAAGAAA 
AAAGTCCTGA CGGACATGGA ATCCCTGATT CGCCAGTTCA TGACGACGAC CATGGGGGTG 
AACGCCCCTG CCGGGCAGGT TTACTTTGCC GCGGAAAACC CGAAGGGAGA GCTGGGTTTC 
TTCCTGGACT CCAAGGGGGG CGGGCTTCCC AACCGCCTGC GCATGCGCTC CCCCTCCTTC 
TGCAACCTGT CCATCCTGCC GGAACTGATG AAAGGCCACC TGGTTTCCGA CGTTCCGGCC 
ATTCTCGGCT CCTTCGACTT CGTGATGGGC GAATGCGACC GTTAA

Protein sequence

MKTSTKTFAI ADTAANADYL TNTSEPLGET MTLNVGPSHP ATHGVLRLVL ELDGEEIISC 
DPVVGHLHRG MEKIGETIQY NQFVPYTDRF DYLAPLSNNI AYACAVEKLL GWELPPRGQA 
LRVLALELSR FSSHILGVGV YGMDVGAMTV FLYCYEEREK IHNFYEQLTG ARFTSSYTRI 
GGQTRDVPNE MLKEVLVFCD EAAKTLDETE ALLLKNKIFI DRLQGVGVIS REKALSWGIT 
GANLRASGIK RDLRKLTPYL GYENYEFDVP VGEHGDCYDR FTVRIEEMRQ SLRIIRQVIE 
TMPDGPINMV DTKGTLPEKK KVLTDMESLI RQFMTTTMGV NAPAGQVYFA AENPKGELGF 
FLDSKGGGLP NRLRMRSPSF CNLSILPELM KGHLVSDVPA ILGSFDFVMG ECDR