Gene Amuc_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1070
Symbol
ID	6274040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1277393
End bp	1278406
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	45%
IMG OID	642613121
Product	glycosyl transferase family 2
Protein accession	YP_001877677
Protein GI	187735565
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.0299214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCAG CCATTCTTCT TTGTTACAAT CAGAAACGTT TTATCAAGGA ACAGTTCCGG 
GCTATTTTAA AACAGGATTA TCTAGGAGAA TGGGAAATAA TTATTTCGGA CGATTTTTCT 
CAGGACGGTT CTTTTGAATG CCTGGAAGAA ATGGTGGAAA AAGAGGGAGA AGGACGGCGT 
ATTATTCTCC ACCGTAACGA AAGCAACCGG GGAATTGCAG GGAATTTGCA ATGTGCCGTT 
CATTTGTCCC GGGGGGAATG GATTATCAAG TTTGACGGCG ATGACATCGC ACGGGAAGAC 
AGGATCTCCT CGTTGGCATC TCTGGCGGAA AAATATCCCG GTCATCTGGT TTACTGCCAT 
TCTTATAATG AAATCGATGA AGATGGACAA CCCGCTTATG GACGCATGTT GCCAGATTCA 
GATTCCGTCG TCGTCAAACC CTACAGGGAA TGTATTTTTG ACATTTCCCA TGTTTACAGC 
TGTTTTGGCG GAAATGCCAT GTACCACAGG TCTTTGTTCA GCGACTTCGA ATATTTGCCT 
TCAGGGGCCG GCATTGCGGA CGATACAATG CTGTCCATGC GCGCCTATTT GAAAAAATCA 
GGCATGGTCG CATCCGGCAA ACGGTGTTCG TACTATCGGA GACACAACAG TAATATCTGC 
AATTTTAAGA GCGGGAACCC CAGGACAATC CTGATCAAGA GATCGGAATT CCTGATAACA 
ACCTGGATAA TGATCATGAA AGAGGTATAC GGCAAGCATA AGTCCGGGGA AATAACATAC 
CAGGCCGCCG ATCGCCTGAT GAGGCTGATT CAGGCGGAAC AGAGAAGGCT CCTGCTCTTC 
CCCTATGCTT CATTCGATAA CAGCCTTCTT ACCAAACTCA AATGGTTTTG GAACATTCTG 
CAATGCAGGC CGAGGCTCTG GCTGGTCAGC ATTCCAAGAT TGCTCCCGTT TTGCCTGCTG 
CAAAGGTATT TGAATATTAA AGACCGGATA AAAAGTTTTC CTTTTTTTCA CTAA

Protein sequence

MISAILLCYN QKRFIKEQFR AILKQDYLGE WEIIISDDFS QDGSFECLEE MVEKEGEGRR 
IILHRNESNR GIAGNLQCAV HLSRGEWIIK FDGDDIARED RISSLASLAE KYPGHLVYCH 
SYNEIDEDGQ PAYGRMLPDS DSVVVKPYRE CIFDISHVYS CFGGNAMYHR SLFSDFEYLP 
SGAGIADDTM LSMRAYLKKS GMVASGKRCS YYRRHNSNIC NFKSGNPRTI LIKRSEFLIT 
TWIMIMKEVY GKHKSGEITY QAADRLMRLI QAEQRRLLLF PYASFDNSLL TKLKWFWNIL 
QCRPRLWLVS IPRLLPFCLL QRYLNIKDRI KSFPFFH