Gene Amuc_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1072
Symbol
ID	6274036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1279869
End bp	1281134
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	52%
IMG OID	642613123
Product	hypothetical protein
Protein accession	YP_001877679
Protein GI	187735567
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.00830956
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGAAAT ATGCTGTGAT CGGAGCCGGG GTTTCCGGAT TGTCCATGGC CGGAATGTTG 
CTGAAGAAAG GGCATGAGGT AGTCGTTTAT GAGAGGGACT CCCGGCCCGG CGGCCTGATT 
AAATGCACGG AAGTACAGGG GAACCTGTAT CATCGTGTGG GAGGCCATGT GTTCAATTCC 
CGGCGGCAGG AAGTGCTGGA CTGGTTTTGG TCCCGGTTTG ACAGGGAGCG CGATTTTGTT 
TCCGCCCGGA GACGGGCTGT TATTTCCCTG GAGGGCGGGG CTGTGGTGGA TTATCCCATT 
GAGAACCACC TCGACCAGTT TCCCGAGGCC GTCCGTTCCT CCATCGTCCA TGAGCTGCTG 
GAACTTTACA GGAATCCTCC CGCGGAGCCC CGCTCCCTGG GTGAGTTTTT TCTGAACCGT 
TTCGGAAAAA CCCTGAACAG CCTTTATTTT ACGCCGTACA ATAACAAAGT GTGGAGGCAG 
GATATCAGCC AAATTGCCAT GGATTGGCTG GAAGACAAGC TTCCCATGCC GAGCGTGGCG 
GAAATCCTGT TGAACAATAT TGGGCACATC AATGAAAGCG CCATGGTGCA CAGTTCTTTC 
TTTTATGCGA AAAACGGCGG TTCCCAGTTT CTGGCGGATA CGCTGGCTCG CGGCCTCAAG 
GTCAGGTATC GGCAGGAAGC TGTAAATATC CTCCCGAAGG ACGGGAAATG GCTCGTACAG 
GGAGAATTGT TTGACAGAGT TGTCTTTACG GGGAATGTCA GGCAGCTTGG GGATTGTTTT 
CCCTGCATGG ATGAATTGCG GCCGTTTTTC CCCCGGATTT CAGAATTGCG CTCTCACGGA 
ACCACTTCCG TGCTTTGCCG GATTTCCCCC AATGATTACA GCTGGATTTA CATGCCCTCT 
CCATCCCACC GCTCTCACCG GATCATTTGC ACGGGGAATT TTTCCAGAAA TAATAATAAC 
GGGGACATCA CCACCGCGAC TATTGAATTT TCCGAGCAAA TGATGGAAGG GGAAATCAGG 
CGCCAGCTGG AGCTTATTCC CTTTTCCCCT GTGTATCTGG CCCATCACTG GGAAGAATAT 
ACCTATCCCG TTCAGGATGT TTCCAGCCGA ACCCTCATAC GGGAACTAAA GGAGTGCCTG 
GAACCGAAAG GCATTTATTT ATTAGGCCGT TTTGCGGAGT GGGAATACTA CAATATGGAT 
GCGGCCATGG GGGCGGCCCT TGATTTGGAT AAAAGGCTGG CTGCGGAGCA GATGACACGG 
GGATAA

Protein sequence

MMKYAVIGAG VSGLSMAGML LKKGHEVVVY ERDSRPGGLI KCTEVQGNLY HRVGGHVFNS 
RRQEVLDWFW SRFDRERDFV SARRRAVISL EGGAVVDYPI ENHLDQFPEA VRSSIVHELL 
ELYRNPPAEP RSLGEFFLNR FGKTLNSLYF TPYNNKVWRQ DISQIAMDWL EDKLPMPSVA 
EILLNNIGHI NESAMVHSSF FYAKNGGSQF LADTLARGLK VRYRQEAVNI LPKDGKWLVQ 
GELFDRVVFT GNVRQLGDCF PCMDELRPFF PRISELRSHG TTSVLCRISP NDYSWIYMPS 
PSHRSHRIIC TGNFSRNNNN GDITTATIEF SEQMMEGEIR RQLELIPFSP VYLAHHWEEY 
TYPVQDVSSR TLIRELKECL EPKGIYLLGR FAEWEYYNMD AAMGAALDLD KRLAAEQMTR 
G