Gene Amuc_0502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0502
Symbol
ID	6275455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	592354
End bp	593475
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	55%
IMG OID	642612552
Product	putative transmembrane protein
Protein accession	YP_001877121
Protein GI	187735009
COG category	[S] Function unknown
COG ID	[COG4299] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.326971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCAC TTTCCGATAC CAGGCCGCAG AGAATTGCGG CCATTGACGC CCTGCGGGGA 
TTTGACATGT TTTTCCTGAC CGGGGGCCTG GCTCTGGTTG TGGCCGGCAT CAATCTTTTT 
TACGACCGGA GCCCCGAGTG GCTGGTGAAG CACAGCACGC ACGTGGCTTG GGAGGGATTC 
GCCGCCTGGG ATCTGGTGAT GCCCCTCTTT TTGTTCATTG TGGGAACGGC CATGCCGTTT 
TCCTTTTCCA AACGCATCGG TTCGGAACCT CTGTGGAAGA TTTACCTGAA GGTTGCCAGG 
CGGGTAGTGG TGCTTTTTTT GCTGGGCATG GTGGTGCAGG GCAATCTGCT GAGTTTTGAA 
CCGTCCAGGA TGTCCCTGTA CTGCAATACG CTCCAGGCCA TCGCCTCCGG CTACCTGATT 
GCGGCCATTT GCCTTCTTCA TCTGTCCATC CGGTGGCAGG TAGCGGCAAC GGGGGGGCTG 
CTGGCTGTGT ACTGGCTGGT CATGAAGTTT GTTTCCTTTT CTGACCCCGC GGTGGGTTCC 
TGTGCGGCAG GAATGCTTGA ACCGGGGAGG AATCTGGCCC TGCTGCTGGA TAAATACCTG 
ATGGGAAACT GGCAGGATGG AACGAATTAT GCGTGGATTC TGGCGCAGTT CGGTTTTGGC 
GCCATGACCA TGCTCGGTCT GCTGGGCGGC CAGATTCTGA AGCGGGTGCA GGGGCACGGG 
AAAAAGCTGG CGTGGCTGTT ATGTGCGGGC GCGGGCTGCC TGGCGCTGGG ATATGCCTGG 
AGCCTGGATT TTCCGATGAT CAAGCGTTTG TTCACCAGTT CCATGGTATT GTGGGCGGCG 
GGATGGTGCT ATTTTCTGCT GTTCCTGTTC TATCTGCTGA CGGATGTGCT GAAATTGAAC 
TGGTTGACAT TCTTTTTCTC CGTAATAGGG AGCAATGCCA TTTTCGTGTA CATGTGGGTA 
TCTCTGTGCC CCCCTACGGG CAATTTCTCC CGGGTATTGT TTGCCGGGTT TAGCGAGTGC 
TTCGGGGATG CGGACAGGTT TGTCTTTTAC CTGTGCAATT ACGCCCTGAT TTGGGGCGTG 
TTGTATTACA TGTACAAAAA CCGGACCTTC ATCAAGGTCT AG

Protein sequence

MSSLSDTRPQ RIAAIDALRG FDMFFLTGGL ALVVAGINLF YDRSPEWLVK HSTHVAWEGF 
AAWDLVMPLF LFIVGTAMPF SFSKRIGSEP LWKIYLKVAR RVVVLFLLGM VVQGNLLSFE 
PSRMSLYCNT LQAIASGYLI AAICLLHLSI RWQVAATGGL LAVYWLVMKF VSFSDPAVGS 
CAAGMLEPGR NLALLLDKYL MGNWQDGTNY AWILAQFGFG AMTMLGLLGG QILKRVQGHG 
KKLAWLLCAG AGCLALGYAW SLDFPMIKRL FTSSMVLWAA GWCYFLLFLF YLLTDVLKLN 
WLTFFFSVIG SNAIFVYMWV SLCPPTGNFS RVLFAGFSEC FGDADRFVFY LCNYALIWGV 
LYYMYKNRTF IKV