Gene Amuc_2027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2027
Symbol
ID	6275445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2460342
End bp	2461343
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	60%
IMG OID	642614087
Product	dihydroorotase
Protein accession	YP_001878618
Protein GI	187736506
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.000191556
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTCTGG AACTGCACTC CCCGCTGGAC ATGCATCTTC ACCTGAGGGA CGGCGATATG 
ATGAAGCTGG TCGCTCCGTT AAGTTCCGCC TCTTTTGCCG GGGCGGTCAT CATGCCCAAC 
CTGGTGCCTC CGGTGGCTGA TGCGGGTGCG GTGCAGGCTT ACCGGCAGCG GGTGCTGGAC 
GCTTGCGGAG ACGATGTATT CCAGCCGTAC ATGACGGCAT TTTTTCGCTC CTATTCAGAA 
AAGGAATTGT CCCGGCTCAA GGAACTGGTG TTCGGCATCA AGCTGTACCC GGCAGGAGCC 
ACCACGAACA GCGAGGGCGG CGTGAAGGCC ATGAAGGATG CGGAAGCTAC CCTGTCCATC 
ATGCAGGAAA TGGATATTCC TTTGCTGGTG CATGGCGAAA GCCACGGCTT CGTGATGGAC 
CGGGAGGCCG AATTCCTGGA TGTTTACCGT GATTTGGCTA CGCGCTTCCC CCGGCTGACT 
ATCTGCATGG AACATATTAC CACGGCCGCC GCCGTGCAGC TGCTGGACGA ATTTGAAAAC 
CTGGCCGCCA CGGTAACCCT CCAGCATCTT CTCATTACTT TGGACGATGT GGCCGGTGGC 
ATGCTGAGGC CGCATCTGTT CTGCAAGCCG ATCGCCAAAA GGCCGGAAGA CCGGGAAGCC 
CTGTTGCAGG CTGCCCTTTC CGGGCATCCC CGCCTCATGT TCGGCAGTGA CTCCGCCCCC 
CATCCCATCC ATGCCAAGGA AGCGTGCGGA TGCGCCGCCG GCGTGTTTAC CGCCCCCATC 
GCTCTTCCTC GTCTGGCGGC CCTGTTTGAC GAACACGGGG CCCTGGACCG GTTGCAGGGC 
TTTGTTTCCG GTCATGCCTG CGCTTTGTAC GGGTTGAATC CGCCTGCCAG GACGGTCCGT 
CTGCAGCGGC GTGAAATGCT GGTGCCGGAC GCTTATGAAG GACATGGACA GAAAGTGGTG 
CCGATGGATG CCGGATGCAC CATTCCTTGG AGACTGATAT GA

Protein sequence

MILELHSPLD MHLHLRDGDM MKLVAPLSSA SFAGAVIMPN LVPPVADAGA VQAYRQRVLD 
ACGDDVFQPY MTAFFRSYSE KELSRLKELV FGIKLYPAGA TTNSEGGVKA MKDAEATLSI 
MQEMDIPLLV HGESHGFVMD REAEFLDVYR DLATRFPRLT ICMEHITTAA AVQLLDEFEN 
LAATVTLQHL LITLDDVAGG MLRPHLFCKP IAKRPEDREA LLQAALSGHP RLMFGSDSAP 
HPIHAKEACG CAAGVFTAPI ALPRLAALFD EHGALDRLQG FVSGHACALY GLNPPARTVR 
LQRREMLVPD AYEGHGQKVV PMDAGCTIPW RLI