Gene Amuc_0638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0638
Symbol
ID	6274167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	751262
End bp	752407
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	58%
IMG OID	642612690
Product	glycosyl transferase group 1
Protein accession	YP_001877256
Protein GI	187735144
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.650689
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCA AACGCCTCCG TCCCGTATTA GCCATAGCAG CGGACCTCCC TCTGGGCCGG 
CTGCTGACGT CTTTCCGTAA TAAGGACCGG CGTACGATTC CCTGGATTTT TTCCCTTTTT 
CATGCTCTGG AATCTCAGGA AGATTTTGAC ATCCACTGGA TCACCCTCAG CAAAGCCGTT 
TCTGCCCCGG AAACCATCCG GATGCGCAAC CAGACCATCC ACATTCTTCC CCTGGGCAGC 
ATGGGCAGGA ATATCCTGAC GGCCCATTTC CTGACCGTCC GGAGAATACG CAAGACCCTG 
AACGATATCC AGCCGGACCT CCTGCACGTA TGGGGCGTGG AGCAGGCTTA CGCTCTGGCG 
GGGATTGCCT TCCGGGGAAA GAAGCTCCTT TCCTACCAGG GAGCCCTCAC CGCCTACTGC 
CAGCGCGCTC CGCAGGCCTT CCTCCTCCAT ATGCAGGCCC TCTGGGAACG GATGGCCGTC 
AAACATTATG ATCTTATCAC GTGCGAATCC CCCTGGGCGT GCGGCCGCGT TGCGGAAATT 
GCCCCCCATG CCCGTCTATC CTGCATGGAA TACGGCGTGG AACCTTCCTT TTACCATCTT 
GCCAGAAAAC CTTCCCCGGA ACCTTCCTGC CTCTTTGCCG GAACCATTTA CGAGTTGAAG 
GGCATTTCCT ACCTGGTGGA GGCCTTTACG CATCCGTCCC TTTCCCATGT CCAGCTGTTC 
ATTGCGGGCA ACGGAGCCCT CAGGGAAAGG CTGGAAGCCC TGTCCACTCC CAATATCCAC 
TGGCTGGGCA GCATTTCCCG CGCAGAACTT CAGCAGCACC TTTCCACGGC GTGGTTCCTG 
GTGCATCCCA CCCTGGGGGA TTGCTGCCCC AACATCGTGA AGGAGGCAAG AGTCATGGGC 
CTTCCGGTAA TCACCACGGA AGAAGGCGGA CAGACTCAAT ATGTTCAGGA CGGCGTATCC 
GGCTATATTG TCCCTGTCCG CAACAGCGCC GCCGTCAGGG AAGCCGCGCA GAAACTTTCC 
GTCAGCCTGG ATAAAGCCAT GTCCATGGGA ATGGAGCGGC ATCAGGAATG CCGCCGCCTG 
CTGGACGTAA AGCAGACAGT AACCGGGTGC CTGTCACGTT ATCATACCAT GCTGTATCCA 
CGCTGA

Protein sequence

MPIKRLRPVL AIAADLPLGR LLTSFRNKDR RTIPWIFSLF HALESQEDFD IHWITLSKAV 
SAPETIRMRN QTIHILPLGS MGRNILTAHF LTVRRIRKTL NDIQPDLLHV WGVEQAYALA 
GIAFRGKKLL SYQGALTAYC QRAPQAFLLH MQALWERMAV KHYDLITCES PWACGRVAEI 
APHARLSCME YGVEPSFYHL ARKPSPEPSC LFAGTIYELK GISYLVEAFT HPSLSHVQLF 
IAGNGALRER LEALSTPNIH WLGSISRAEL QQHLSTAWFL VHPTLGDCCP NIVKEARVMG 
LPVITTEEGG QTQYVQDGVS GYIVPVRNSA AVREAAQKLS VSLDKAMSMG MERHQECRRL 
LDVKQTVTGC LSRYHTMLYP R