Gene Amuc_0920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0920
Symbol
ID	6274245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1099438
End bp	1100859
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	58%
IMG OID	642612974
Product	oxidoreductase domain protein
Protein accession	YP_001877533
Protein GI	187735421
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.746532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.6877
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATTT TCTCATCACG CAGACAATTT CTCAAATCTT TGGGGCTTGC GGCCGGAGCG 
GCTGCCGCCG GAAATGCCCT CCCTGGGAAG GCTGTGGAAA TCCCTGCCGG AGACCATCTC 
TGGAAATCCG CCTCTCCGGC GGCTCCGAGG CCTTCCGGTT CCACATACAT GGGAGGGTTC 
AAGGCTCCCC GGCTGGGTCG CATCAGGCTG GCCTTCATCG GCGTGGGAGG GCGCGGGTTC 
TCCCACCTGG CGCAAATGTG CGTGATGGAT GGAGTGGAAA TCGTGGGCAT ATGTGATTTG 
AAGGAAGAGT TGACGAAACG CGGCGTGGAT CGCGTGCTCT CCAGAATGGG GAAAAGCCCT 
TTGGGCTATT CCGGCGGCGA TATGGAATAC CTGACCATGC TGAAGGAGCT GAAGCCGGAT 
GCCGTCATCA TCAGTACGGA TTGGAGTTCG CATGCCAGAA TCGCCTGCGA CAGCATGAAG 
CACGGCGCTC ACGCCTTTGT GGAAGTTCCT CTGGCCGTCT CTCTGGAGGA GCTCTGGAGC 
CTGGTGGATA CCAGCGAGGC CACCAGGAAA CATTGCATGA TGATGGAAAA CGTCAACTAT 
GGGCGGGATG AACTCATGTT CCTGAACATG GTCCGGCAGG GCGTCATCGG CGATTTGCTT 
CACGGGGAGG CCGCGTATAT CCATTGCCTG GTGACGCAGC TGGGGGACAC GCGCGGGGAA 
GGGGCCTGGC GGCCGGAATA TCATACCAGA ATCAATGGCA ACCTGTACCC CACCCACGGG 
TTGGGGCCGG TGGCTCAATA TATGAATTTG GAGCGTGGAG AGGACCGTTT CTGCCGTGTG 
GCGGCGTTCG CTTCTCCTGC TCTCGGGCGC AATGCCTACG CTAAAAAGCA TCTTCCCGCC 
GATCACCGCT GGAACAATAC TCCATTCATC TGCGGTGACA TGAATACGGC TGTTGTCAAG 
ACGCAGCTGG GGCGGACCAT TCTTGTCCAG CTGGATGAGA CGTCCCCCCG GCCTTACTCC 
CGCGCCAACC TGATCCAGGG AACGGAGGGC ACGCTGGCTG GTTTCCCAAC CCGCGTGGCG 
GGTGAAAAGC TGGGCAACGG CAATTATCAT GAATGGATTG AAGGCAGGGA AAAACTGGCC 
GCTATTTATG AAAAATACGA TCATCCCCTC TGGAAACGCA TCGGGGAGCT GGCCACGAAA 
ATGGGCGGTC ACGGCGGTAT GGACTTTGTG ATGCTTTCCC GCATCGTGGA ATGCCTCCGG 
AACGGAGAAC CAATGGATCA GAACGTTTAC GAAGGAGCTT CCTGGTCTTC CCTGCTGCCG 
TTGACAGCCC GTTCCATCGC CCAGGGCGGG ATGCCTGTGG AATTTCCGGA TTTTACCCGC 
GGAGACTGGA AAACCACCAT GCCGCTGGCC GTGGTTTCAT GA

Protein sequence

MSIFSSRRQF LKSLGLAAGA AAAGNALPGK AVEIPAGDHL WKSASPAAPR PSGSTYMGGF 
KAPRLGRIRL AFIGVGGRGF SHLAQMCVMD GVEIVGICDL KEELTKRGVD RVLSRMGKSP 
LGYSGGDMEY LTMLKELKPD AVIISTDWSS HARIACDSMK HGAHAFVEVP LAVSLEELWS 
LVDTSEATRK HCMMMENVNY GRDELMFLNM VRQGVIGDLL HGEAAYIHCL VTQLGDTRGE 
GAWRPEYHTR INGNLYPTHG LGPVAQYMNL ERGEDRFCRV AAFASPALGR NAYAKKHLPA 
DHRWNNTPFI CGDMNTAVVK TQLGRTILVQ LDETSPRPYS RANLIQGTEG TLAGFPTRVA 
GEKLGNGNYH EWIEGREKLA AIYEKYDHPL WKRIGELATK MGGHGGMDFV MLSRIVECLR 
NGEPMDQNVY EGASWSSLLP LTARSIAQGG MPVEFPDFTR GDWKTTMPLA VVS