Gene Amuc_2113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2113
Symbol
ID	6275495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2574808
End bp	2575917
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	59%
IMG OID	642614175
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_001878703
Protein GI	187736591
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.512598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.05877
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCTCT ACGTCCACAT TCCTTTCTGC CACCGTATTT GCCCGTACTG CGCTTTCTTC 
AAGCACACGC CGGCCTCCAC GGACATGAAA TCATTCATCC GTGCTCTGGG CAGGGAGGCG 
GAATCCCGCG CAGCCGCTCT GGCCACAAAC CGCGGAGGGG AAACGGCTAC GCTTTATTTT 
GGCGGGGGTA CTCCCTCCAT GCTCTCGGAC ACGCATCTGG GGCATTTTAT GGAAACCCTG 
GATCGTCTCG TGCCCGTGGA CAAACTGGAC GAATTCTCCT TTGAGGCCAA CCCCGCCACC 
TTTACGGAAA AAAAAGTGCG CTTTTGGCGC AGCCTGGGCA TGACACGTGT CTCCCTGGGC 
GTGCAGTCCC TGGATTCCGG CATCCTGCAT CTGCTGGGGC GCGAACATAC CCCGGCCCAG 
GCTCTGCACT CCGTGGAAAT GCTGAAAAAT GCGGGAATGC CCCATATCAA CATGGATCTC 
ATGTTCGCCA TTCCGGGGCA AACCCTCTCC ATATGGGAAG CCACCCTGAA GGAAGCTGTC 
CGCGCCGGAA CGGACCATAT CTCCGCCTAC AACCTCACCT ATGAAGAAGA CACGGAATTC 
TTCCGGAGCC TGCTGAGGGG AGAGAAAAGG CAGGATCCGG ACGAAGACGC CGCCTTTTTT 
GAACTGGCGG AACACATGCT GGAGGCGGCA GGCTTGCGCC ACTATGAAAC CTCCAACTAC 
GCCCGGGAGG GCTGCATCTC CCCCCACAAC ATGGCCTACT GGAAGGGAGA GGACTATGTG 
GGCATAGGGC CTGGCGCGGT CAGCACCATC AACGGCATAC GGTACTCCAA CACGCGGGAT 
ACGGACGCCT ACATACGCAG CACGCTGGAA AACGGCCTCC CCCTTTCCGA ACAGGAACCC 
GTCACCGAGG AAGACTACCG CTTGGAACGC ATTGCCCTGA TGCTCCGGAC GGATGAAGGA 
TTGCCGCTGA AATACATTCT GCCGGAATCC CGTCCTCTGC TGGAACAATA CCGGGAACTG 
GGCTTGGCGG ACATTTCCCC GGAACAAAGG TTCATCCTGA AAGGCCGCGG ACGCCTGCTC 
GTGGACGCCA TCGCAGCGGA ACTGTGCTGA

Protein sequence

MHLYVHIPFC HRICPYCAFF KHTPASTDMK SFIRALGREA ESRAAALATN RGGETATLYF 
GGGTPSMLSD THLGHFMETL DRLVPVDKLD EFSFEANPAT FTEKKVRFWR SLGMTRVSLG 
VQSLDSGILH LLGREHTPAQ ALHSVEMLKN AGMPHINMDL MFAIPGQTLS IWEATLKEAV 
RAGTDHISAY NLTYEEDTEF FRSLLRGEKR QDPDEDAAFF ELAEHMLEAA GLRHYETSNY 
AREGCISPHN MAYWKGEDYV GIGPGAVSTI NGIRYSNTRD TDAYIRSTLE NGLPLSEQEP 
VTEEDYRLER IALMLRTDEG LPLKYILPES RPLLEQYREL GLADISPEQR FILKGRGRLL 
VDAIAAELC