Gene Amuc_1085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1085
Symbol
ID	6274019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1296592
End bp	1297809
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	642613136
Product	Carbohydrate-selective porin OprB
Protein accession	YP_001877692
Protein GI	187735580
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000116954
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	8.02155e-19
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAGAAGC ATAACATAAT AGCAATGGCG TTGACGAGCC TCATGGCGCT TCCTGTAATC 
GCTCAAGACA GCACCCCTGC TGTTGGTGAT ATTTTGCAGG GCATCAACAT GTTCACTCCG 
GAAGAAGGTG ATCCTGCCTG CAAGGTGAAG GCCAATGAGA AATACGGCAC CCAATGGGGT 
GTGGATATGG CCTACGGGCT TTGGAATACG GAAAAGGTTT CCGATGTTAA GCGCCATAAC 
AACCTGGCTC TTCTTCATGC CCAGCTTAAT CAGCGCCTTA TTGAAGACAA GGCCAACGGG 
GGAACCTGGT TGCGTGTGGA ATTTTCCGGT TCATGGGGGC TGGATCGTGA ATCCGCACAG 
AGCGATACGT TTTTCACTGA AGCCTATGCC ACGGCTTCCG GCTTGCATGC TGACGCGATG 
GGGCCTCATG AAGGAATATT CCCTGAAGTG GCGCTGATGC AATACTTTGC AGGGAAGCGC 
GCTTGCCTCA TCGCAGGTAT GGTGAATCTC ACCAACTACT TTGATGCTGT CAGCATTGCC 
AATGACTCCT TCTCCTCTTT CACCAATGAC GGGTTTGTGA ACTCCACTAT CCTACCTTTG 
GTGGACAGCA ATATTGGCGG TATTCTGCAA GTTGAACTCA ACCGCAATAA TTACATGATG 
GTTGCCGTTT CCCGCACGGG ATGCGATTCC GGATACAATC CTTTTAATTC CGATTATTGC 
GATGGTTATG CCGTGGTTGG CGAATACGGC CATATCTTTG CCGACGGCGC TGCGACTCTC 
CGCATCAATC CGTTCTATAC CAGCACGGAT GTGGACATGG ACGACGGGAC CGGGGAACGC 
CGCCGCCAAA ATGCCGGGCT TGTCGCGAGC ATCGAATATA CTCCCTGCGA TCCTCTGACC 
ATTTACTCCC GCGCCGGATT TGCCGCCAAA CAATACTTGA GCAACTCCGC TGAATTCTCC 
GTGGGCGCCA ACATTAAGCT CTTCCCTTCC CGTGAAGATG ACTTCCTGGG CATTTCCTAC 
GGTGTGTTCA AGGGGCAGAC CCCCTGTGAC GGAGAGCGCG CTGAGCATAA CCGCGAACAG 
GTGCTGGAAG TCATGTACAG CTTCCAGGTG AATGATTATT TCAAAGTTGT TCCTCACTTC 
CAGTACATCG CGAATCCGGC TTACAGCACT TCCAGCGAAA ACATTCTCTG GGGCGTTCAG 
GCAGTCTTTT CTTTCTGA

Protein sequence

MKKHNIIAMA LTSLMALPVI AQDSTPAVGD ILQGINMFTP EEGDPACKVK ANEKYGTQWG 
VDMAYGLWNT EKVSDVKRHN NLALLHAQLN QRLIEDKANG GTWLRVEFSG SWGLDRESAQ 
SDTFFTEAYA TASGLHADAM GPHEGIFPEV ALMQYFAGKR ACLIAGMVNL TNYFDAVSIA 
NDSFSSFTND GFVNSTILPL VDSNIGGILQ VELNRNNYMM VAVSRTGCDS GYNPFNSDYC 
DGYAVVGEYG HIFADGAATL RINPFYTSTD VDMDDGTGER RRQNAGLVAS IEYTPCDPLT 
IYSRAGFAAK QYLSNSAEFS VGANIKLFPS REDDFLGISY GVFKGQTPCD GERAEHNREQ 
VLEVMYSFQV NDYFKVVPHF QYIANPAYST SSENILWGVQ AVFSF