Gene Amuc_1423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1423
Symbol
ID	6275672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1707539
End bp	1708750
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	56%
IMG OID	642613480
Product	hypothetical protein
Protein accession	YP_001878026
Protein GI	187735914
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.994888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.140536
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCATGC CTCCCGTCTT ACCCCTGATG AAAAAGCCCG CACGCCTCTG CCTGGCGGCG 
GGAACTCTGT TCACCCTTTT CCTTACCCCC CTTGCACAGG GGCGCACCTG GACCAACCTC 
CAAGGGAAAA AACTGGAAGC AGAATTCATC AGGCTGGACG GCCAGAAAGC CGTGCTGAAA 
CGTTCCGGCG GCCAAACCGT CTCCATTCCC CTCACCCAGC TCTCCCGGGA AGACAGGGAT 
TTCATCGCGG AACAGGAAAA AGGAGGGGCA CTCCCCTCCA ATACGGCGGA CAATTACCAC 
CTGCCGTGGC CCAGGAGCGT CAAATGCCCG GACAATTTCA AGGTGGAAAC CATCAAGGAG 
GAACCGGGAG AATATATTTA TGAAACACCC CATTTCCGCT TCATCTGCGA CGCCAAGCTG 
GGCACCGGCA TGATCAAGCG CCTGGGCCTC CTCTTTGAGG CCACCCACTT GGCCAACAAA 
ACCCTTCCTA TAGGAAACTC CCCTGCCCAT GACGATTCCG CCAAATTCCC CGCCTACCTG 
TATGAAAAAT TCAGCACCTA TCTGGAAAAC GGCGGACGCG AAGGCACGGC GGGCATCTTC 
CTGGGGACAA CGCGGCCAGG GGACCGCGGA AGAATTCTGG TTCCGTTCGA TTCCCTGGGA 
GTCAAAACCA TGGGAAGCAC ATACGTCATT GACCGTGACA AGGACGCTTC CACCCTCATC 
CATGAACTGA CGCACCAGCT CATGTCTTCG CAGGCCAAGC AGGCCAGCTG GTTTTGTGAA 
GGCTCCGCGG AATACATGGG CATGACGCCC TATGCCGGAG GCCGCTTCAA CTTTGGAGCC 
AACCGATCCC ACATTGTCTC CCGCGTGACG GAATACGGCA AAAAAAATAC GGGGGGACGG 
GCCCTTGGGG ATGACTTTGA GGCGCCCGGC CTGGAAGCTT ACATGAACAT GCCCTATTCC 
CAGTTCACGG GAGAAAACGC CAACCTGAAC TACGGCCTGG CCGCCCTGAT GGCCTACTAT 
TTTTACCACA TGGACGGCAA GGGCGATGCC CGGCGCATCA AGAATTACAT GAAAGCCATT 
CAATCCGGAA CCAGTGAAAA GGAAGCTCAG AAACTCCTCC TTGACGGACG GAGCTATGAA 
GAACTGGCCA AAGAAATTGA ACAGAAATGG CGCAAGGCCG GCGTTAAAAT CCGCTTCCGT 
TCCTCTTCCT GA

Protein sequence

MFMPPVLPLM KKPARLCLAA GTLFTLFLTP LAQGRTWTNL QGKKLEAEFI RLDGQKAVLK 
RSGGQTVSIP LTQLSREDRD FIAEQEKGGA LPSNTADNYH LPWPRSVKCP DNFKVETIKE 
EPGEYIYETP HFRFICDAKL GTGMIKRLGL LFEATHLANK TLPIGNSPAH DDSAKFPAYL 
YEKFSTYLEN GGREGTAGIF LGTTRPGDRG RILVPFDSLG VKTMGSTYVI DRDKDASTLI 
HELTHQLMSS QAKQASWFCE GSAEYMGMTP YAGGRFNFGA NRSHIVSRVT EYGKKNTGGR 
ALGDDFEAPG LEAYMNMPYS QFTGENANLN YGLAALMAYY FYHMDGKGDA RRIKNYMKAI 
QSGTSEKEAQ KLLLDGRSYE ELAKEIEQKW RKAGVKIRFR SSS