Gene Amuc_1335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1335
Symbol
ID	6275398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1611881
End bp	1613281
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	49%
IMG OID	642613391
Product	Bacteriophage capsid protein-like protein
Protein accession	YP_001877940
Protein GI	187735828
COG category	[R] General function prediction only
COG ID	[COG5511] Bacteriophage capsid protein
TIGRFAM ID	[TIGR01539] phage portal protein, lambda family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0058198
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGCAG GAAATGTCCA GATTTTGGAT CAGTTCGGCC GGCCGTTTTC AAGCCGCCCC 
ATTTACAAGA GCGGCAGTTA TGATGACGGG CTGCAGCGGC TTCCGAATTA TCTCAAAGAA 
CCGGAACAGC TTTCCGGGAA CCTTACCCGG AAGAACCTTA TTTCCGCATC CCGTCTGTTG 
TACAAAAATA ATGGCGTTGT AAAAGGCGCC GTGAACATGA AGGCTGAATA CTCTATCGGG 
AAAGCGTTTC TGTTCAAATC TCTGTGCAAG AATCCGGAAG TTGCGGCGAA GTATGACGAG 
TACATCAAGG CGTTTTACAA AGTTGCATGC GTGAACGGAA AGAATTTTCA CTCGCTCCTG 
TATCTGATCT CCACCGCCAT CGACATTGAT GGGGATTGCT TTGTAATGTT GACGGAAAGC 
AAGACGGGGT TTCCTCAACT GCAATTTATC CGGGCAAACC GTGTTTGCTC TCCTAAAAAT 
GGCCTTATTG ACTCCGGAAA ATATAAGGGA TTGAACGTGC TGCACGGCGT CATAACCAAT 
CGCATGGGAC GTGAAATCGC TTATTGGCTG GACGGCGACG AACCAGGGGG AGGTGAAATC 
ATCCCGGCAT CCTCAATACT TCATATCGTG GATGACGACT TTCTTTCCAC CTGCCGGGGC 
GAGCCTCTCT TCTCTCATGG CCTCAAGGAA TTCCGATACA TTGATGATAT CAATACAGCC 
GAACTTGGGG CCATGAAGAT TGCGTCACAA ATTGCCCTGG TAAAAAAGAA CGAAACGGGA 
GAAGTTGACA TAACGCAGGC TTATGACAAA CCGTCCAATA ATGGGGAGGT GCTCATCCGG 
AATACTGGTG ATAAGCAAAT TGTATTTTTG AAGTCTGAAG ATTCCCTTGA CTCCCTGAAG 
ATTGAGCGCC CCTCTCCGAA CTACATGAGT TTTTCAGAAC GGCTTCTGAA GGGCGTTTTA 
TCCGGGGTGG GCGTGCCCTA TGATATCGTG GTCAATCCGG ACTCAAGCGG CGTTGGGAAC 
AGAATGTCTC TGTCCAAATT TGACAATACC ACGCGAGATC GGGCCACGCT GCTTGAAGAT 
GCTGCCAGAC TGCTTGTACA GTATATCTTG GCCGTAGGTA TCCAGCGGGA GGACATCCCG 
CACGCGGAAG GCTGGTGGAA CATGATGTTC AGCCGCGCCA AGCGTCCAAG CGTAGACATG 
GGCCGCGACT CCAACAGCCA GTTGAAAGAG TACAATGCCG GTATTAAAAA CCTCACAGAA 
ATCTGTGAGG AAAACGGAAC GCAGGTTGAG GACCATTTGA GAATACGTGC CAGGGAAGCC 
GCCATTGCGG AGAAGTTGCG CCGTGAAGCT GAAGCAGAAT TTGGAGTAGA AATCTCTCCG 
GATTATATCA GGAAGTTTTA A

Protein sequence

MKAGNVQILD QFGRPFSSRP IYKSGSYDDG LQRLPNYLKE PEQLSGNLTR KNLISASRLL 
YKNNGVVKGA VNMKAEYSIG KAFLFKSLCK NPEVAAKYDE YIKAFYKVAC VNGKNFHSLL 
YLISTAIDID GDCFVMLTES KTGFPQLQFI RANRVCSPKN GLIDSGKYKG LNVLHGVITN 
RMGREIAYWL DGDEPGGGEI IPASSILHIV DDDFLSTCRG EPLFSHGLKE FRYIDDINTA 
ELGAMKIASQ IALVKKNETG EVDITQAYDK PSNNGEVLIR NTGDKQIVFL KSEDSLDSLK 
IERPSPNYMS FSERLLKGVL SGVGVPYDIV VNPDSSGVGN RMSLSKFDNT TRDRATLLED 
AARLLVQYIL AVGIQREDIP HAEGWWNMMF SRAKRPSVDM GRDSNSQLKE YNAGIKNLTE 
ICEENGTQVE DHLRIRAREA AIAEKLRREA EAEFGVEISP DYIRKF