Gene Amuc_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0719
Symbol
ID	6273858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	847992
End bp	849104
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	55%
IMG OID	642612771
Product	protein of unknown function UPF0118
Protein accession	YP_001877337
Protein GI	187735225
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000137163
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTTC AGAAAGAATC CGGAAAAGAG GGCCTGAAAA TTCTGCTCAT GCTCGCCAGC 
GTCATTATCA TCACGGCCGG GCTGCAGGCG GGAAAACCGG TGCTCCTGCC CATCGTTCTA 
TCCGGCTTTC TGGCAATCGT CAGTTATCCG CTGACGACTT TTTTCAAGAG CCGTCTTTGC 
TTCCCGCACT GGCTGGCAGT GACTTTCACG GTCATCATGG ACTTTGGCAT TCTGGTGGGC 
CTGGGCTATC TGGCCCAATA CCTGGGGCAG GATCTGGCCA AAACGGTCAC GGTCAAATAC 
CAGCCTCTTA TGATGGAGAA AATCCATGAA CTCCGCGCTT TCCTGATTGA ACAGGACTGG 
AACAACCTGG CTGACCAGAT GCTTCAGGAA CTTCCGGACC TGCTCAACGG CCAGCGCATC 
GTGGCGTTTT CCACAGGGGT GATGGGGCAG TTAGCTTCCA TGCTGACCTT CACCACCCTG 
ATTCTGATCC TGATGACTTT CTTCCTGGGG GAAGCCCCCC GCTTCCGGGC GAACATCAAT 
AAACTGGGGC ATAACAGCGA CACAGGCATC CGCAAATTCT CCAAGGCCCT GGCCGGAGTT 
CAGAAATATC TCATTATTAA AACCTTCATC AGCGCAGTTA CAGGGCTTCT GGCTTTCCTG 
CTTTGCTATT ACATGAACGT GGACTTTCCG CTGTTGTGGG GCATCGTGGC TTTCGCCCTC 
AACTTCATTC CCACCTTCGG CTCCATCATC GCGGCTATTC CCCCCACGCT TCTCGCCATG 
CTTCTGATCA GCCCGACTGC GGGCATCATT GTTGCCGGCG GCTACCTGGT GATTAACACA 
GCCCTGGGAA ACTGCCTGGA ACCCATGCTG TTGGGACGAC AATTCGGCAT TGTGACCAGT 
ATGGTTCTGC TCTCCGTCAT CTTCTGGGGC TGGGTATGGG GCCCCATCGG CATGCTGCTG 
GCCGTACCCA TTACCATGTT GATTAAACTC GGGCTGGAAA GCTCCAAGGA TCTCGCCTGG 
ATCGCCCAGC TCATTGACAA CCCTCCCACT CCCAGATTCC CTCTCCCCCC TCTCCATTCC 
GGGAAAACCA ACGAAAGCAC AACCAAGGAA TAA

Protein sequence

MTFQKESGKE GLKILLMLAS VIIITAGLQA GKPVLLPIVL SGFLAIVSYP LTTFFKSRLC 
FPHWLAVTFT VIMDFGILVG LGYLAQYLGQ DLAKTVTVKY QPLMMEKIHE LRAFLIEQDW 
NNLADQMLQE LPDLLNGQRI VAFSTGVMGQ LASMLTFTTL ILILMTFFLG EAPRFRANIN 
KLGHNSDTGI RKFSKALAGV QKYLIIKTFI SAVTGLLAFL LCYYMNVDFP LLWGIVAFAL 
NFIPTFGSII AAIPPTLLAM LLISPTAGII VAGGYLVINT ALGNCLEPML LGRQFGIVTS 
MVLLSVIFWG WVWGPIGMLL AVPITMLIKL GLESSKDLAW IAQLIDNPPT PRFPLPPLHS 
GKTNESTTKE