Gene Amuc_1222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1222
Symbol
ID	6275585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1468707
End bp	1470575
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	54%
IMG OID	642613278
Product	oligopeptide transporter, OPT superfamily
Protein accession	YP_001877828
Protein GI	187735716
COG category	[S] Function unknown
COG ID	[COG1297] Predicted membrane protein
TIGRFAM ID	[TIGR00728] oligopeptide transporters, OPT superfamily [TIGR00733] putative oligopeptide transporter, OPT family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.107355
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCTA CGTCCCCCCA ATCTTCCAGC CCTCTCCCCT CCTGCTTGGA AAAACCGCTG 
CCTCTGGATG GATTCCAAGG TACTCCGGAT GAAGTAGAAC AGCAATGGTA CGATCAAGTT 
TATCTGGGTT CCGGAGACAG AATGAAGCAG CTTACCTGGA GAGCCGTCAT CGTAGGCATG 
CTTCTAGGCT CCATCCTTTC CCTCACTAAT CTGTACGCCA ACCTCAAAAT GGGATGGTCC 
TTTGGGGTGG CTCTGACGGC AGGAATTATC TCTTTTGCCC TCTGGAACGC CTTTGTGCGC 
CTGGGCATTT CCAAATCCCC CATGACTATT CTGGAAAATA CATGCATGCA GTCCGCTGCC 
AGTTCTGCAG GCTATTCTAC AGGGGGAACC CTCACCTCTG CCGTAGCCGC CCTGCTCCTG 
CTGACAGGAC AGCACATGCC TCTTGGCACT ACCTTCGCCT GGATATTTTT CATTGCCGTA 
CTGGGTGTCA CCATGGCCAT TCCGATGAAA CGCCAGATGA TCAACATTGA ACAAATAAGG 
TTCCCAGACA GTATTGCTAC GGCGGAAACC CTCAAAGTTC TCTATTCTGA AGGCAAAAAG 
GCGGCGGGAC AGGCCAAAGC CCTTCTTTAT TCTGCCCTTT TCGCCGCCGC TAATGCCATC 
GCCATGGCTG CAGGAGGAGA ACGATGGCTT GGAACGGTCC AGCAACATAT CCTCGGCAAC 
TGGTACCAGC GTACTATCTT CTTCAAATGG GATCTCATGT TCGTGGGTGC GGGAGCTCTG 
GTAGGCATGA AAACATCCCT CAGCCTCTTC ATCGGAGGAA CCGTTTGCTG GGCTCTTTAC 
GTTCCGTGGC TGGAAAGCCA GAAATTGCTT CCCGCGGGAG CAGGTTATCG GGAGAGCGTA 
AGCTGGACCC TGTGGGGAGG AACCGCCTGC ATGGTCGTCG CCAGCATTGT GGCTTTCCTA 
TTCCAATGGA AAAGCATTGT TCGTTCCTTT TCTTCCCTGG GTGCCATGTT TTCCCTGAGT 
AAAAAACGAA AACTGACAGA TGTGGAAAAA ATAGAAACGC CCATGAGCTG GTTTCTAACA 
GGCCAGCTTA TCTCTCTGGG AGCTCTCGGC TATCTGGCTC ATACATCATT TAACGTTCCG 
TACTGGATGA GCTGCATCGC GGTAGTCATA TCCTTTTTCC TGGCGCTGGT CGTCTGCCGA 
ATCACCGGAG AAGCCAATAT TACACCCACC GGAGCCATGG GAAAAGTTAC ACAGCTCATC 
TTCGGAGGGA TTGCACCCGG GCACGTAACA GCCAACCTGA TGGCGGCCAA TATCACTTCA 
GGAGCGTCCA GTTCCTCGGC AGACCTGCTC GTAGACCTCA AAGTAGGCTA CCTGCTGGGA 
GCTAACCCCC GCAAACAATT CATCGCCCAG TTTTCCGGAA TTTTTCTGGG AACCCTCGTC 
TCCGTGCTGG CCTTCCGCTC CATGGTTCCG GATGCGAACG CTCTCCAGGC TTTCAATGCT 
CCGGGAGCCA GAACATGGGC GGCCACAGCG GAAGCACTGG GCATGGGGTT CAGCCATTTG 
CACAGCATCA AGGTGCTTTC CATCATTGCA GGCGGTATTC TCGGACTCAT TCTGGTGCTT 
ATTCCCCGCT ATATTCCCCG GACAGGAAAA TGGCTCCCCA CCCCCATCGG CTTCGGCCTG 
GCCTGGGCCA TCCAGTGGAA CGACTCCTTC CTTTTCTTTA CAGGAGCTGT GCTCGGCTGG 
GCTGCGGACC ATCTTTTCAA GGCCAAATCA CGAGAATATA AAGTCCCCAC CGCCTCCGGC 
ATCATTGCAG GCGCAGCCCT CACGGGAATG GCCATTCTGA TGTTCAGCAT TTACCAGGCA 
GCCCTCTGA

Protein sequence

MASTSPQSSS PLPSCLEKPL PLDGFQGTPD EVEQQWYDQV YLGSGDRMKQ LTWRAVIVGM 
LLGSILSLTN LYANLKMGWS FGVALTAGII SFALWNAFVR LGISKSPMTI LENTCMQSAA 
SSAGYSTGGT LTSAVAALLL LTGQHMPLGT TFAWIFFIAV LGVTMAIPMK RQMINIEQIR 
FPDSIATAET LKVLYSEGKK AAGQAKALLY SALFAAANAI AMAAGGERWL GTVQQHILGN 
WYQRTIFFKW DLMFVGAGAL VGMKTSLSLF IGGTVCWALY VPWLESQKLL PAGAGYRESV 
SWTLWGGTAC MVVASIVAFL FQWKSIVRSF SSLGAMFSLS KKRKLTDVEK IETPMSWFLT 
GQLISLGALG YLAHTSFNVP YWMSCIAVVI SFFLALVVCR ITGEANITPT GAMGKVTQLI 
FGGIAPGHVT ANLMAANITS GASSSSADLL VDLKVGYLLG ANPRKQFIAQ FSGIFLGTLV 
SVLAFRSMVP DANALQAFNA PGARTWAATA EALGMGFSHL HSIKVLSIIA GGILGLILVL 
IPRYIPRTGK WLPTPIGFGL AWAIQWNDSF LFFTGAVLGW AADHLFKAKS REYKVPTASG 
IIAGAALTGM AILMFSIYQA AL