Gene Amuc_0119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0119
Symbol
ID	6274915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	146653
End bp	147972
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	59%
IMG OID	642612164
Product	hypothetical protein
Protein accession	YP_001876745
Protein GI	187734633
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCGTT CCTCCATCAT GCTTCTGGCA ACCATGCTGT GCGTTTCCTG CGTATCGCAC 
CGGCCTATCC AGGACAGCAG CTCCCCGCCC ATTGACGCGG CCAATCCCCT GGACGGCACC 
CCCGTGGCGC TGGCGTGGAG CTCCGGAACG CAATTAATGA TGGGCGTAGA CACGGGAGCA 
GTCCAGACAT CCCTGCTTTT CTCCCCGGCA GTGGAATCCA TCGGCGCACG CCTGCGCGGC 
AGGGGCGCCA TGCGCACGGC CAACGTGCCC GTTTCCCTGA AGGATGACGG GGAACCCATT 
TCCCGGAAAC AGGACGTAGT AATGGCAGAC CAGGCCCCGT ATGACGGTTT GCTGGGCTGG 
GAATGCATCC GGAAATATGT GTGGAACATC AACTATCCCA AACGCTCCCA CCGTTTTTTC 
AATAAACTTC CCTCCAGAAT AAAAAGCTGG AACAAGCTTT CCCTGATTCC CGGATCCGAC 
TATCCGCAAA TCGCGGACAG GCACGGAAGG CGCATCATTC TGGACACGGG AGCCCCCCAC 
GCCGTTTACA TCTCCAAAAA ACGCTGGAAT GCCATTAAGC AGGCCTACCC GGATGCGTTC 
GTCAGCGTCT ATTCCGGCTA TAGCCCCGCC GCAGGCGGCT TTTACGCCCA CGAATGCATG 
CATGTAAGCT CCTTCCAGCT CGGTCCACTG GAATTAAAAA ATATCCTGCT CTGTGAAAGC 
TTCGCCAACC CGGAAGTGAT GGGCATCCCC GATGACATCG ACATCATCCT GGGCTACGGC 
GCTCTGGCCG CACGCCAGTT CTGGCTGGAC GGCCCGGGGA ACGCCCTTTA TTTCAGCTCC 
ACCAGCCACC GGATGCCCGC CCCCGCCTCC TTCAACCTGA TGGGAGGCAC CTTTATCCAG 
GACAGCAACG GGAACGGCCC CATGAAAGCT TACGTGGCAG AGTGGTCTCC CGCATGGGAC 
GCCGGCCTCA GGACGGGAGA TGTGCTTATT TCCATCAATG GAAGAAAGAA TCCCTATCCG 
GACCTCGTAG AATATGTTAC CACCCAGCGG GGGGCTCAGG CCAGCGTGGT GGTCCAGCGC 
AGGAACAGGC TGGTGCGCAT CCAATGGGAA GTTCCGGCCG CGCCCCCTGC CGGGGATTAT 
TACCCCACGC CCCAGGCCAT TACGGAACAG GAATTCGAAA ACCACGTCAG GCAGCAGGAA 
AAAAAAGAAC AGACCCAGCC CTCCGCAGAC GGCCAGCAGC CTCCGGCTAC GGCCGGAGAA 
ACTCCGGATG AAGCCTCTCC CGCAGCTGAC GGGAAAACGG ACAAGGCCTC CGCTGCCTGA

Protein sequence

MFRSSIMLLA TMLCVSCVSH RPIQDSSSPP IDAANPLDGT PVALAWSSGT QLMMGVDTGA 
VQTSLLFSPA VESIGARLRG RGAMRTANVP VSLKDDGEPI SRKQDVVMAD QAPYDGLLGW 
ECIRKYVWNI NYPKRSHRFF NKLPSRIKSW NKLSLIPGSD YPQIADRHGR RIILDTGAPH 
AVYISKKRWN AIKQAYPDAF VSVYSGYSPA AGGFYAHECM HVSSFQLGPL ELKNILLCES 
FANPEVMGIP DDIDIILGYG ALAARQFWLD GPGNALYFSS TSHRMPAPAS FNLMGGTFIQ 
DSNGNGPMKA YVAEWSPAWD AGLRTGDVLI SINGRKNPYP DLVEYVTTQR GAQASVVVQR 
RNRLVRIQWE VPAAPPAGDY YPTPQAITEQ EFENHVRQQE KKEQTQPSAD GQQPPATAGE 
TPDEASPAAD GKTDKASAA