Gene Amuc_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2095
Symbol
ID	6275642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2546550
End bp	2547734
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	49%
IMG OID	642614157
Product	hypothetical protein
Protein accession	YP_001878685
Protein GI	187736573
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAAC ACGCACACCT TCCAAAAGCA GGCATTATTA CAAGCCACTA CTATTTCATT 
AAAACAAACT ACGGTTCACT GCTACAAAAT TTTGCCCTCC AGCGTTACTT GGAAAAAATG 
GGCCTATTTC CATTCCTGAT CAGACAGGAA GAAATCAGCC AGCCCATTTC CTTCCGGGAG 
AAAATAAAGT TTTATCTTCT TCATCCTCTC CAATTGTTCC GCCGGCTTTT CCAAAAACCA 
GCACGGGAAG CTGAGGAAAA AGCACAGAGG ATTGCCCGCT TCAACCGGGA GCACCCGCGC 
CCCTTTGAAT CTTTCATCAG CAAACACCTT AACACCACCC CCATCACCTA TGACCGCGTT 
ACATTGCGCG AGCATCCGCC GGAAGCGGAT GTTTACCTGG CGGGCAGCGA CCAAATATGG 
ACCCTTGATG ATTTTGACAA ACTGCTGAAT TTTGCTCCTC CGGGAAAACG AATCGCCTAT 
GCGGCCAGCG CCAATTGGGG AAAACAAAGC AAACGATGGT TTATTGAAGC CAGAAAGGAG 
CTGCCTTATT TTACAGGAAT CTCCGTCAGG GAAACTGAAG GCAGGGAAAT ATGCCAAAAA 
GCCGGTATGG AGCAAGTGGA AGTCGTTCTC GACCCAACCC TGTTGCTGGA TCCTTCAGAA 
TACACCTCGC TAGTCACGGC ACAATCCGCC TACCTTCCTC CTGACTCCAT TCTCGGGTAT 
TTCCTCAATA CGGACGCCCT TACTGAAATT TACTGGAATC AGATTCTTGA TTCCTTCAAG 
GGAAATCCTC TTCGTATCAT TCCCCTGCAG GGAACGGAAC TCTGCATTCC GGAAGACAGC 
ATCATCACCC CTGATCCTTA TGAATTCATC CAGGCCTTCA AGGAAGCGAA AAACATCATC 
ACCAATTCCT TTCATGGTAC GGTTTTTTCC ATCATCATGC GCAAGCCGTT TCTGAGCATT 
CTTCAGGCAG GAGACACGGC CATTCAAAAC ACGCGTTTCT TCTCTCTCCT GAAATCCCTG 
GGGCTGGAAG ACAGGATTTA CGCGCCGGAG AGAGGTCTCA TGCGGGAACA GATGGAACAG 
AGGATCCAAT GGGAAGCCGT AGAAAACAGG CTGGAACAGC TTCGCGGCCA CTCTGCCGAA 
TTTCTGGAAA AGGCCATTCA ACAAAGCATT TGCCGCCATG GCTGA

Protein sequence

MNQHAHLPKA GIITSHYYFI KTNYGSLLQN FALQRYLEKM GLFPFLIRQE EISQPISFRE 
KIKFYLLHPL QLFRRLFQKP AREAEEKAQR IARFNREHPR PFESFISKHL NTTPITYDRV 
TLREHPPEAD VYLAGSDQIW TLDDFDKLLN FAPPGKRIAY AASANWGKQS KRWFIEARKE 
LPYFTGISVR ETEGREICQK AGMEQVEVVL DPTLLLDPSE YTSLVTAQSA YLPPDSILGY 
FLNTDALTEI YWNQILDSFK GNPLRIIPLQ GTELCIPEDS IITPDPYEFI QAFKEAKNII 
TNSFHGTVFS IIMRKPFLSI LQAGDTAIQN TRFFSLLKSL GLEDRIYAPE RGLMREQMEQ 
RIQWEAVENR LEQLRGHSAE FLEKAIQQSI CRHG