Gene Amuc_1260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1260
Symbol
ID	6275415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1520651
End bp	1522081
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	49%
IMG OID	642613317
Product	glycoside hydrolase family 37
Protein accession	YP_001877866
Protein GI	187735754
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGGG ATTGGAAAAA AGAGATTCCC CTGCCAGTAT ATCCAAACCG GGAAATGACG 
GAACTTTATC ATCAAACATG GGAAATTGCG GCTGGGCGCG TCAGGAAAGG GCCGGAAGGG 
CTCCCCGCGT CTCCCTATAT GGATGAAAAT TGCTACGAAG ATCAAATCTG GATATGGGAC 
ACCTGTTTCA TGGTGCTTTT TGCCAAGTAT GCGCCCAGGG CGTTTCCCGG AATAGAAAGT 
CTGGATAATC TTTACAAACC TATCCATGAA AAAGCCGCTA CGCCCCTTAG AATCCATTTA 
GTGGATAATC CCCCGCTGTT TGCTTGGGTG GAAAAGGAAT ATTTTGATTT CACAGGAGAT 
AAGAGGCGGC TTAATCATCT TCTTAATGAA AAGCGGTATT TGCAGAAGCA TTTCAAATGG 
TTTGCCCGGG CTAAGGCTGG TGAACGGTTT GAATGTTCCC CCCAGCGTAT TTACTTGAAT 
TCCATTGGGG ATGATGGCTT TACCTGGACG GGGAGAGCGA GCGGTATGGA CAATACTCCC 
CGCGGGCGTG ATGCCGGAGG ATACCATAAG GTGCTATGGG TGGATGCCAT TTCCCAGCAG 
GCTCTTAGCG CCCACTGCAT TGCTACCATG GAACAGGCTT TGGGAAATGA GAATGAAGCA 
AGAAAATGGA ACGCTGAATA TGAAGCGCTT AAGAAAAAGA TCAACCATCT TTACTGGGAT 
GAGCGGGATG GATTTTATTA CGATGTCACC ATTGCGGACA AACAGCCCTG CCGCGTTAAA 
ACCATTGCTT CCTATTGGCC CCTTCTGGCC CGGATTGCGT CCAGGGAACA GGCGCGGAGC 
ATGGTAAATC ATCTGATGAA TCCCGGGGAA TTCGGAGGCA GTTATCCTAC TCCTTCCCTG 
GCCCGCTCGG ATAAGGATTA TCATCATCAA ACCGGGGATT ACTGGCGGGG AGGAATTTGG 
CTGCCGACGA CATATATGGC GATTAAGGCC ATTGAAAAGT ATGGCTACCA TGAGGAGGCC 
GATGCTATTG CCGAGAAGGT TATCAACCAG CAGCTTGCCG CTTACAGGAA TATGGAACCG 
CATACTGTCT GGGAGTGCTA TAGCCCAAGC GGAGATGCCC CCTCCACAGA ACACGGACGC 
CGTGTAAGAC CGGAATTTTG CGGCTGGTCA GCCCTGGGGC CGATTGCGTT GTTTATTGAA 
AATGTGCTGG GATTTAAGAA AGTGTCTGCC GCCGGAAAGG AAGTCCGGTG GAGGTTGAAA 
AAAAACAAGG GCCGCCATGG AATCAGGAAT TTGAGGTTTG GCGATATTGT AACCGATATT 
GTTTTTGATG GTAAAGGCAC GGTGTCGGTC ACGTCGAATG CTTCTTACTC TTTAATCATT 
AATGGCAATA CTTATTCAGT AAGGAAGGGG GATACTGAAA TTAAGCTGTA A

Protein sequence

MNRDWKKEIP LPVYPNREMT ELYHQTWEIA AGRVRKGPEG LPASPYMDEN CYEDQIWIWD 
TCFMVLFAKY APRAFPGIES LDNLYKPIHE KAATPLRIHL VDNPPLFAWV EKEYFDFTGD 
KRRLNHLLNE KRYLQKHFKW FARAKAGERF ECSPQRIYLN SIGDDGFTWT GRASGMDNTP 
RGRDAGGYHK VLWVDAISQQ ALSAHCIATM EQALGNENEA RKWNAEYEAL KKKINHLYWD 
ERDGFYYDVT IADKQPCRVK TIASYWPLLA RIASREQARS MVNHLMNPGE FGGSYPTPSL 
ARSDKDYHHQ TGDYWRGGIW LPTTYMAIKA IEKYGYHEEA DAIAEKVINQ QLAAYRNMEP 
HTVWECYSPS GDAPSTEHGR RVRPEFCGWS ALGPIALFIE NVLGFKKVSA AGKEVRWRLK 
KNKGRHGIRN LRFGDIVTDI VFDGKGTVSV TSNASYSLII NGNTYSVRKG DTEIKL