Gene Amuc_0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0633
Symbol
ID	6274179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	744587
End bp	745624
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	642612685
Product	glycosyl transferase family 2
Protein accession	YP_001877251
Protein GI	187735139
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.810954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.460894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAAC CGTTCTTCAG CATTATTATC CCGGCCTATA ATCTGGAGAA TTATATTGCT 
GCCACCCTTC AGTCAGTACT GGTTCAAACA TTTCAGGATT TTGAGATCAT CATCGTGGAT 
GACGGTTCTT CCGATGAGAC TGTTTCCATC ATCCAATCTT TTCATGACCC CAGAATTCGC 
CTGGTTTCCC AAGTTAACGG CGGCGTATCG CGAGCGCGAA ACGCAGGGAT GAAGAAGGCC 
GTGGGGGCTT ACATCGCTTT CCTGGACGGA GACGATTACT GGTATCCCGA GCATCTGGAG 
CTGGCAGCCG ATTTTTTCAA CCGTCATCCG GAGATATTGG CCTATGCCAA CCGCTACATG 
AGGGATGAAC TGGAGGCCAT CCCGCCGCGC CCTCCATCTT ATCCCGAATC TATCCGGAGA 
TTGGGGATAC GGGGAGTGCT TTTCATGAAT TCCAGCAGCG TAATCCTGAA TTCGTCTCTT 
GCGTCCCGGC TTCCCCCCTG GGAAGAAGCG ATGCCCTATG GGGAAGACGG CCTGTACTGG 
ACACGGTGCA TGCGGGGGAC AGGCCTGATC GGGCTGGGAG GCTCCGTCAC CTCCATCTAC 
AGGCAGAGAG CTTCTTCCGC CATGCATGAC GAGCATTACC AGCATGTCTC CCTCCACTCG 
CTCATTGCGC CTCTGCTGAA TGAGCTTGAA GCCATGAAAA ATCCCAAATG GCAATTTGCC 
GTCCATTATC TGGTCATCAG GGAATTGCAT CCCAAAAGAC TGTTATCGCT CAACGCAGAG 
GAGCGGATTT CCCTGACGGG CAGGATCAGG AAAATCATGC ACCCATGCCT GAACCGGCCG 
TTTTTGGACT CCTATATGAA AGCGTGTTCC GCAAGGGCAG GCATGGAACA GTCATTTTCC 
GCGCTCATGG ACAGAACCAT GTTCTCCTGC AAATGGCTGG ACCGCCTGGA AAGGATGGGC 
CGCTCCCTGT TTTTCCGGCT GCAAACCAAT AACGGAATGG GGGGCAAACA CCAAGATCCA 
GTCCGTTCAC GCTCATGA

Protein sequence

MQKPFFSIII PAYNLENYIA ATLQSVLVQT FQDFEIIIVD DGSSDETVSI IQSFHDPRIR 
LVSQVNGGVS RARNAGMKKA VGAYIAFLDG DDYWYPEHLE LAADFFNRHP EILAYANRYM 
RDELEAIPPR PPSYPESIRR LGIRGVLFMN SSSVILNSSL ASRLPPWEEA MPYGEDGLYW 
TRCMRGTGLI GLGGSVTSIY RQRASSAMHD EHYQHVSLHS LIAPLLNELE AMKNPKWQFA 
VHYLVIRELH PKRLLSLNAE ERISLTGRIR KIMHPCLNRP FLDSYMKACS ARAGMEQSFS 
ALMDRTMFSC KWLDRLERMG RSLFFRLQTN NGMGGKHQDP VRSRS