Gene Amuc_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1140
Symbol
ID	6273900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1362134
End bp	1363177
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	58%
IMG OID	642613192
Product	hypothetical protein
Protein accession	YP_001877747
Protein GI	187735635
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.263074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGTC CAATCAGGAG ATTATTCGTC AACGGGTTCC CGAGCCTCTA CGGAGGAGCG 
GGAACGGAAC TTCACCACCA GATCATTGTC TGGCGCAAGA TGGGCGTGGA AGTCCATCTC 
ATCCCGTCCT GGGATTACCA CGGGGAGCCT CTTTACAACG AGATGGTTTC CCTGGGCGTT 
ATCATGCACG CCCCAGCGGA CTGGTCGGCT GTCCAACCCG GCGACCCCGT GCTCGGTTTC 
TGCAATGCCG GCTTCCTCAA CGCCTTGCCG GAAATACGAA GGCATACGAA ACGCACAGTT 
TTCATCAACT GCATGACGTG GCTTTTCCCC AGGGAAAAGG AGGCCATGCA AAAGGGGGAA 
ATCGCCATGT TCCTCTATCA GAATGAAGCC GTCCGCCAGG AAGCCATGCC CGTGCTGCGC 
AAGCTCAACG GCGACCCGCA AGTGCAGTTC CTGACCTTCA GGCCCTATTT CCATGCGGAA 
TCCTTTCCCT TTATCCGGGA ACGCGATGAG GATTTCTTCG GTTGCGGGCG CATCTCCCGC 
CAGGATGCCG ACAAATTCGC GGCCAACACC CTGCATATCT ACGGCGCATT CGTATCCCCC 
GTGCAGAAGC GCGGCCTTTT CCTCGGTTTT GACAAGAGGA GCGAAGCCAA GATAGGCCGG 
CCCTTCGACT GGATTCGGAT TGCCCGCAAT CAAAGGGAAG TTTCCCAGCA GGATTTTTAT 
AGGCACAGCC GGATCATCCT CCAGCCGACG GATACGACGG AGAACTGGCC CCGCATCGGC 
TTTGAGGCGA TGGCCAGCGG AAGCGTGCTC ATTGTGGACA ACCGGGGCGG GTGGCGGCAG 
ATGGTGGAGC ACGGCAAAAC AGGATGGCTG TGCAGCAACG AAAGGGATTT CATCTACTAC 
GCTTCCAAAA TGGCCTGTGA ACCGAATCTT CGCGATGACA TGGCGGAGGC GGCCCGGGCG 
CGCGGCCTGG AGCTGGGCGG GCTGGATGTT TCCCTGGAGA GCTGGAAGGA AGTGCTGGAG 
GCGATGGCAA GACTCCCGGA ATGA

Protein sequence

MSSPIRRLFV NGFPSLYGGA GTELHHQIIV WRKMGVEVHL IPSWDYHGEP LYNEMVSLGV 
IMHAPADWSA VQPGDPVLGF CNAGFLNALP EIRRHTKRTV FINCMTWLFP REKEAMQKGE 
IAMFLYQNEA VRQEAMPVLR KLNGDPQVQF LTFRPYFHAE SFPFIRERDE DFFGCGRISR 
QDADKFAANT LHIYGAFVSP VQKRGLFLGF DKRSEAKIGR PFDWIRIARN QREVSQQDFY 
RHSRIILQPT DTTENWPRIG FEAMASGSVL IVDNRGGWRQ MVEHGKTGWL CSNERDFIYY 
ASKMACEPNL RDDMAEAARA RGLELGGLDV SLESWKEVLE AMARLPE