Gene Amuc_1645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1645
Symbol
ID	6274641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1987924
End bp	1988982
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	57%
IMG OID	642613705
Product	dihydrouridine synthase DuS
Protein accession	YP_001878246
Protein GI	187736134
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.173532
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAGAC CCATGCTCCT GGCCCTGGCC CCCATGAAAG ATGTGACGGA TCTGGCTTTC 
CTCAACACAT TGAAGGACTT GAATTCCCTG CCGGATTATT TCATCACGGA GTATTTCCGG 
ACGGTGGCCC ATCATAAAAA GATGTCGCCA TACATTCTGC GCTCCATTGA TGAAAATCCT 
ACAGGCCGCC CCATTTACGG ACAGCTCGTG GGCCATGAAC CGGAATACCT GGCAAGGGAT 
GCGCAGGTCC TGATGGAACA CGCCTGTGCA GGCGTGGATC TGAACATGGG CTGCCCCGCT 
CCCATCGTAT GCCGGAGAAA TGCGGGCGGA GGCATGCTGC GGTCCCTGAA GGCCATGGAC 
GCGGCCCTGG GAGCGCTTCG GGACGTATTG CCCCCCGGAG CCTTCACCGT CAAATGCCGC 
CTGGGATACG AAACGCCGGA CGAGTTTGAA CGGATTCTTC CGGTAATTGC CTCCCATTCC 
CCGGACAGGG TGTGCATCCA CGCCCGCACC GTCCGTGAGG GCTACCGCTC CCCAGTACAC 
CCGGAATGGG TGAAATGGGC CGCAGGAATG CTGAAATGCC CAGTAGTCGC CAACGGAAAT 
ATTGTGGATG CAGCCACAGC GGAGGCATGG GTGCGGCTGG CCCGGCCAGC TGGGCTGATG 
ATTGGGCGGG CAGCCCTGCG CAATCCCTGG ATATTTTCAC AGCTTCATTC CCGCTTTCAG 
GGCCATCCTG CAGCAGACCT TACCTTCCGG AACGTGCTGC ACTACATTCG CCGCCTTTAT 
GAACGCACGC GGGAAATGCA GGAACATTAT GTGGAGGAAA AACACATCCA CCGCATGAAA 
AAATATCTGG TTTATACCGC GCGGGGACTT CCCGACACTT TTGACCATTA CATGAAAAGG 
GCGAAAACCG CCCGCGATTT CATGCGCATT TGCGAGGATA TTCTGGATAA CGACGCACCC 
TTTGCCCCCA CTCCGCCGGA AGACACGCAT CTCTTTGCCC ATTTCCATAC CCTTCTTGCG 
CAAGAGGAAG CTTGTCTCCC TCCCGGAATT CAGGTATGA

Protein sequence

MHRPMLLALA PMKDVTDLAF LNTLKDLNSL PDYFITEYFR TVAHHKKMSP YILRSIDENP 
TGRPIYGQLV GHEPEYLARD AQVLMEHACA GVDLNMGCPA PIVCRRNAGG GMLRSLKAMD 
AALGALRDVL PPGAFTVKCR LGYETPDEFE RILPVIASHS PDRVCIHART VREGYRSPVH 
PEWVKWAAGM LKCPVVANGN IVDAATAEAW VRLARPAGLM IGRAALRNPW IFSQLHSRFQ 
GHPAADLTFR NVLHYIRRLY ERTREMQEHY VEEKHIHRMK KYLVYTARGL PDTFDHYMKR 
AKTARDFMRI CEDILDNDAP FAPTPPEDTH LFAHFHTLLA QEEACLPPGI QV