Gene Amuc_1531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1531
Symbol
ID	6274477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1832918
End bp	1834309
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	59%
IMG OID	642613590
Product	Anthranilate synthase
Protein accession	YP_001878133
Protein GI	187736021
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACTC TCCAACAGCG CAGCCGCCGC CTGAGCGCCG ATCTGGAGAC CCCTATCAGC 
CTGTTTCTGA GCCTGACTCA GAACAAAATT CCCGGACTTC TACTGGAAAG CGCGGAAGTG 
GACGGCAGAT GGGGGCGCTA CAGCATCATC GCCTGCGATT ATCTGATGAC CGTTTCCTGT 
GTGGACGCCA GGCTTTCCCT TTCCATCAAA GACGACCGTC TGGCTTCCCT GAAGGAGCTG 
GAAGGCATGC CTTACCTGGA TGGACTGCGC TCTCTGATGC AACGTCTGGA GCTGGTGGGG 
GACGATATGA GGCAGGCTCC CATTACGCGG GCTTTGTACG GCTATTTCGG GTATGAAACC 
GCCGCCCTGT TCCAGCCCAG GCTGGCGCAG GCCATTCCGG CTTCTTCCGC AGAGTCCTGC 
CTGGTGCTGG CCGGCACCGT GATTGTTTTT GACCATTTGT ACAATCGCCT TACCCAACTC 
AGCCTGGGTG AACACCGGGA TTTGTCCCAT GCCCCGCTCC ATGGGGCGGA GGAACCTTCC 
GTCGGGGAAG TTTGCCGCAC ACCGGACCAG GCAGCCTACA TGAAGGGGGT AGAGCATATC 
AAGGAGCTGC TGCATGACGG GGAAGCCATC CAGGTGGTGC TTTCCTCCCA GGCTTCCGCG 
GAGTTCCACG GAGACGCTTT CATGCTGTAC CGCCGCATGC GCAGCATTAA TCCTTCCCCA 
TACATGTTTT TCATGCGCCT GCCGGAGGTG ACGCTGTTCG GATCTTCTCC GGAACTGATG 
GTGCGCTGCA CAGACGGCAA GCTTCAGCTT TCCCCCATTG CCGGAACGCG CAGGCGCGGC 
AGGGATGACG AGGAGGATGC AGCTCTGGCT GCCGATCTCC TGAAAGATCC GAAGGAATGT 
TCGGAACATG TCATGCTGGT GGATCTGGGC CGCAACGACC TGGGCCGTGT CGCCAAGCCC 
GGTTCCGTGA AACTGGAACG CCTGATGGAG ATTGAACGTT TTTCCCATGT GATGCATATG 
ACTTCCCGCG TGACCGCCCA GGTGAACGAC GGGTTGGACG TCTTGGACAT TCTTGGCGCT 
GCCTTCCCGG CCGGGACGGT TAGCGGAGCC CCCAAGGTGC GCGCCATGGA AATCCTGGCG 
GAGGAAGAGC CTCTGCCGCG CGGACCGTAC GCCGGATGCA TCGGATGGCT GGGATTGGAC 
AAAAACGGCG TCCACATGGA TTCCGGCATC ACCATCCGCA GCATGTGGGT GAAGGATGGG 
CGCATCCACT GGCAGACGGG AGCCGGCATC GTATATGATT CCGATCCGGC CGCGGAATGG 
CAGGAATGCA TGAACAAGGG TAAGATTATT GACGTTATTT TGAAAGGAGA AGACCATGTT 
TCTGTTCATT GA

Protein sequence

MITLQQRSRR LSADLETPIS LFLSLTQNKI PGLLLESAEV DGRWGRYSII ACDYLMTVSC 
VDARLSLSIK DDRLASLKEL EGMPYLDGLR SLMQRLELVG DDMRQAPITR ALYGYFGYET 
AALFQPRLAQ AIPASSAESC LVLAGTVIVF DHLYNRLTQL SLGEHRDLSH APLHGAEEPS 
VGEVCRTPDQ AAYMKGVEHI KELLHDGEAI QVVLSSQASA EFHGDAFMLY RRMRSINPSP 
YMFFMRLPEV TLFGSSPELM VRCTDGKLQL SPIAGTRRRG RDDEEDAALA ADLLKDPKEC 
SEHVMLVDLG RNDLGRVAKP GSVKLERLME IERFSHVMHM TSRVTAQVND GLDVLDILGA 
AFPAGTVSGA PKVRAMEILA EEEPLPRGPY AGCIGWLGLD KNGVHMDSGI TIRSMWVKDG 
RIHWQTGAGI VYDSDPAAEW QECMNKGKII DVILKGEDHV SVH