Gene Amuc_0375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0375
Symbol
ID	6274866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	449414
End bp	450460
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	55%
IMG OID	642612426
Product	Dihydroorotate oxidase
Protein accession	YP_001876995
Protein GI	187734883
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCACCCG CCTTATATTC CGCCGCTAAA AGTGTATTAT TCCAAATGAA TCCGGAAACT 
GCCCACAAGG TGACCTTGTG GGGGTTGCGC CTGGCAGAAA AGATGCGTGT ACTACCTCTA 
GTAATGGGGG AAGTTCCTTC TGATCCTGTG GAAATCCTGG GGATGAAATT CCCCAACCGG 
GTGGGACTTG CCGCCGGAAT GGACAAGGAA GCGGATACGG TAAGCGCTTT TGGCCAGGCC 
GGATTCGGTT TTGTGGAAGT GGGTACGCTG ACGCCCCGGC CGCAACCGGG CAATGAAAAG 
CCCCGCCTGT TCCGGCTGAT TCCCCAGAAA GCTATTATCA ACCGGATGGG ATTTAACAAT 
GAAGGTATTG CCGCCGGAGT GGAAAACATT CGTTCCGCCA CTCGTTTTCA CGGTGTTCTG 
GGGGTCAATA TCGGGAAAAA TAAAATAACT CCCAATGAGG ATGCCGCCCA GGATTACCTT 
ACTTGTCTGC GTGCGGCATG GCCTGTGGCG GATTATATAG CCATTAATTT CTCTTCTCCC 
AATACGCCAG GCCTGCGCGA CCTTCAGGCG GCGGAACCCG CTGCCCGTCT GCTGGCTTCC 
CTGAAATCGG AGCAATCCAA CTTGGCTGCG GAAACGGGGC GCCATGTGCC CATTTTTATG 
AAAGTGGCTC CTGATGTGAC AGATGAGCAT ATTGCGGAGC TCAGCCGCGT TTTTCTGGAT 
GAGGGACTGG ATGGTCTTAT TGCTACGAAT ACGACTCTTT CCCGCGTCGG GGTAGAGGCC 
AATCCTCGGC ATGAAGAAGC AGGCGGCCTG TCAGGCGCTC CTCTGACGGA ACGGTCCACG 
GAAGTTATTG GAGCTTTTGC TTCCGAATTG AAAGGACGTA TTCCGATCAT TGGCGTTGGA 
GGCATTATGA ACGGGGTGGA CGCCGTCGCC AAAATCAAGG CTGGAGCCAG CCTGGTGCAG 
CTTTATACCG GCTTCGTTTA TCGCGGCCCG GACCTTATCC GGGAATGCGT GGAAGCCATG 
AAGGCCGAAT GCCCTGTTCA CCGCTGA

Protein sequence

MSPALYSAAK SVLFQMNPET AHKVTLWGLR LAEKMRVLPL VMGEVPSDPV EILGMKFPNR 
VGLAAGMDKE ADTVSAFGQA GFGFVEVGTL TPRPQPGNEK PRLFRLIPQK AIINRMGFNN 
EGIAAGVENI RSATRFHGVL GVNIGKNKIT PNEDAAQDYL TCLRAAWPVA DYIAINFSSP 
NTPGLRDLQA AEPAARLLAS LKSEQSNLAA ETGRHVPIFM KVAPDVTDEH IAELSRVFLD 
EGLDGLIATN TTLSRVGVEA NPRHEEAGGL SGAPLTERST EVIGAFASEL KGRIPIIGVG 
GIMNGVDAVA KIKAGASLVQ LYTGFVYRGP DLIRECVEAM KAECPVHR