Gene Amuc_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1119
Symbol
ID	6273950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1338657
End bp	1339814
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	53%
IMG OID	642613170
Product	hypothetical protein
Protein accession	YP_001877726
Protein GI	187735614
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAAAC GACTTCTCTC CGCATTTTTT TCTCTGTTCT TTCTGGGAGC GGCCTCCGGG 
ACATCCTTTG CGGAAGTCAC CGTTCCGGAC GCCCTGAAAG ACCGGATTGC TCTGAAAAAA 
ACGGCCCGTC AGCTCAATAT CGTTTATTTT CTGGGCAGTG ATACGGAACC CGTTCCGGAT 
TATGAACGGC GCCTCAGCGA ACTGCTCCTT TACCTCCAGC AGTTTTACGG CAAGGAAATG 
CAGCGGCATG GCTATGGCGC GCGTTCCTTC GGCCTGGACA TCAAATCCCC AGGCCGCGTG 
AACATCATTG AATACAAGGC CAAAAATCCG GCGGCCCATT ATCCTTATGA AAACGGAGGC 
GGCTGGAAAG CGGCCCAGGA ACTTGACGAA TTTTTCAAAG CCCATCCGGA CAGGAAAAAA 
AGCCAGCACA CGCTCATCAT CATGCCCACC TGGAATGACG AAAAGAACGG CCCCGACAAT 
CCCGGCGGAG TTCCCTTTTA CGGCATGGGG CGCAACTGTT TCGCCCTGGA TTATCCGGCC 
TTCGATATCA AACACCTGGG GCAGAAAACA AGGGAAGGAA GGCTGCTGAC CAAATGGTAC 
GGAGGCATGG CCCACGAATT GGGGCACGGC CTTAATCTGC CGCACAACCA CCAAACCGCC 
TCGGACGGTA AAAAATACGG CACGGCCCTG ATGGGTTCGG GCAATTACAC GTTCGGGACC 
AGTCCCACGT TCCTGACCCC GGCCAGCTGC GCCCTGCTGG ATGCCTGTGA AGTGTTTTCC 
GTCACCCCGT CCCAGCAATT CTACGAAGGC AAGCCGGAAG TGGAGGTCGG GGACGTAGCC 
ATTTCTTTTA AAGGAGACCA GATTCTGGTT TCCGGCAATT ATAAAAGCCC CCAGACCGTC 
AAAGCTCTGA ATGTTTACAT CCAGGATCCT CCTTATGCGG TCAACCAGGA CTATGACGCC 
GTTTCCTTCT CCCGGCGCCT TGGAAAAAAG AGCGGGAAAT TCTCCATGAA AATTGACAAA 
AAAGAGCTGG AAGGATTGAA CAATAACGAA TTCCGCATTT CCCTCATGTT CATTCTCGCC 
AACGGGCTGC ACATGCAGAA GCATTTCACG TTCCATTGGG ACGCTCTCCA GGATTACAGG 
GACGGAAGCA AATCCTGA

Protein sequence

MLKRLLSAFF SLFFLGAASG TSFAEVTVPD ALKDRIALKK TARQLNIVYF LGSDTEPVPD 
YERRLSELLL YLQQFYGKEM QRHGYGARSF GLDIKSPGRV NIIEYKAKNP AAHYPYENGG 
GWKAAQELDE FFKAHPDRKK SQHTLIIMPT WNDEKNGPDN PGGVPFYGMG RNCFALDYPA 
FDIKHLGQKT REGRLLTKWY GGMAHELGHG LNLPHNHQTA SDGKKYGTAL MGSGNYTFGT 
SPTFLTPASC ALLDACEVFS VTPSQQFYEG KPEVEVGDVA ISFKGDQILV SGNYKSPQTV 
KALNVYIQDP PYAVNQDYDA VSFSRRLGKK SGKFSMKIDK KELEGLNNNE FRISLMFILA 
NGLHMQKHFT FHWDALQDYR DGSKS