Gene Amuc_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0104
Symbol
ID	6274955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	128919
End bp	130283
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	59%
IMG OID	642612149
Product	protein of unknown function DUF214
Protein accession	YP_001876730
Protein GI	187734618
COG category	[V] Defense mechanisms
COG ID	[COG0577] ABC-type antimicrobial peptide transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCC TTCCTCTCCT TAAAACCTGC ATCAGGGCCC TGGTGCGCAA TCCCATGCGC 
GCAGCCCTCA CCATCCTGGG CATCATCATC GGCATTGCCG CAGTAATCGC CATGGTGGAA 
ATCGGCCAGG GATCTACGCT CCAGATTAAA AATACCATCG CTTCCATGGG GGCGGACACG 
CTGAATATCC GCCCCGGAGC CATCTCCAAA AGCGGCGTCA ATACCGGCGC GGGCGGACGG 
GCCTCCCTGA CCAACGCAGA CTGCGAAGCC ATTGCGAAGG ACTGCCCCAT GGTTCTGCGG 
GCTACCCCCG TGGTGCGCGC CAGCGGCCAA GTCATTTACG GCAACAAGAA CTGGAGCCCG 
GAAACTGTAG AGGGCGGTTC CGTGGAATAC CTGAAAATCA AAAGCTGGTA TGACATGGCG 
CGAGGCCAGC CCTTCTCCGA GGAAGATGTG GAACAGGCCA GGCGCGTGTG CGTCATTGGC 
CAGACGGTGG CCAAGGAACT TTTCGGGGAC GAAGACCCGC TGGGCAAGGA TATCCGCATC 
AAGAATGTCA TGTTCAAAGT CATCGGCATC CTTCAGAAAA AAGGGGCCAA CATGATGGGA 
CGCGACCAGG ACGACTCCAT CATCCTCCCG TGGACAAGCA TCCGCTACCG CCTCCAGGGC 
CTGGGCGGCG GTTCCACCAC CACTTCCACC GGCAACAGCA CCACCACCTT CAACCGGGCA 
GATAAATACA CCGCCAGTTC CGTGGATTAC TACACGGAAA CTACGGACCA GCCCTATACG 
GACGCGCCCC ATCCGCGGCG CTTCAACAAT ATTGATTCCA TCATGGCTCA GATTTCAGAC 
CCGGAACGCT CCTCCGAGGC CATTGACCAG ATTACGGAAG TGATCCGTGC CAAACACAAC 
CTCAAGGACG GCCAGCTGGA CGATTTCCGG GTATGGGACA TGGCGGAAAT GTCCCGCGCC 
ATGAGCAGCA CCACGGAAGT GATGACCAAT CTGCTGATGA TCGTGGCCAT GATCTCTCTG 
GTCGTCGGCG GCGTCGGCAT CATGAATATC ATGCTCGTTT CCGTCACGGA ACGGACCAAG 
GAAATTGGCC TGCGCATGGC GGTGGGCGCC CGTCCGCAGG ATATCATGCG CCAGTTCCTG 
CTGGAAGCGG TGCTGCTCTG CGTGGTGGGC GGCGCGCTGG GCATCATGCT CGGCAAGGCG 
ATCTCCATCA TCGTCAGCCG CACCATGAAC TGGGCCACGG CCTCCTCCCC GGAAGCCATG 
GCTCTGGCTG TAGGCGTCTC CGTATTCATC GGCCTGGCCT TCGGATGGTA CCCCTCCTGG 
AAGGCGTCCA AGATGGACCC CATTGATGCC CTTCGCCACG AATAA

Protein sequence

MKFLPLLKTC IRALVRNPMR AALTILGIII GIAAVIAMVE IGQGSTLQIK NTIASMGADT 
LNIRPGAISK SGVNTGAGGR ASLTNADCEA IAKDCPMVLR ATPVVRASGQ VIYGNKNWSP 
ETVEGGSVEY LKIKSWYDMA RGQPFSEEDV EQARRVCVIG QTVAKELFGD EDPLGKDIRI 
KNVMFKVIGI LQKKGANMMG RDQDDSIILP WTSIRYRLQG LGGGSTTTST GNSTTTFNRA 
DKYTASSVDY YTETTDQPYT DAPHPRRFNN IDSIMAQISD PERSSEAIDQ ITEVIRAKHN 
LKDGQLDDFR VWDMAEMSRA MSSTTEVMTN LLMIVAMISL VVGGVGIMNI MLVSVTERTK 
EIGLRMAVGA RPQDIMRQFL LEAVLLCVVG GALGIMLGKA ISIIVSRTMN WATASSPEAM 
ALAVGVSVFI GLAFGWYPSW KASKMDPIDA LRHE