Gene Amuc_1771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1771
Symbol
ID	6274798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2156064
End bp	2157239
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	56%
IMG OID	642613834
Product	aminotransferase class I and II
Protein accession	YP_001878370
Protein GI	187736258
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000897955
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.363557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATGA ATTGGCAGAA CAAAATAGCG GAGCAGGTAA GCTCCATACC CCGTTCCGGC 
ATCCGGGAAT TTTTTGACCT GGTCACGGGA CGCACGGATA TCATCTCCCT GGGCGTAGGG 
GAGCCGGACT TCGTGACGCC GTGGAATATA CGGGAAGCGG CCATTTACTC CCTGGAAAAG 
GGGCACACCT CCTACACTTC CAACTATGGG TTGGAATCCC TGCGCCGTTC CATCGTCAAA 
TACGTGGACG GATTCTTCCA TGTCAACTAC GACCCCCTGC GCGAAGTGCT GGTGACGGTA 
GGCGTAAGCG AAGCCATAGA TCTCGCTCTC CGTGCCATTC TGAATCCGGG GGACGAGGTT 
CTTTATCACG AACCCTGTTA TGTCTCCTAT GCCCCCAGCG TCAATATGGC CTACGGCGTA 
GCTACCGCCG TGCCTACAAG CAAAAGGGAT CTTTTCGCCC TGAACCCGGA GTTGCTGGAA 
GCGTCCATTA CACCGCGGAC CAAGGTGCTG ATGCTCAACT TCCCGACGAA TCCGACCGGA 
GCGGTGGCCC CTGTGGAAAC CCTTCAGGAA ATTGCCCGCA TTTGCATCAG GCACGACCTC 
ATCGTGCTGA CGGATGAAAT TTACAGTGAA CTGCGTTATG ACGGCAAGCC GCATGTTTCC 
ATAGCTTCTC TGCCGGGGAT GAAGGAACGC ACGCTCCTGC TGCACGGATT TTCCAAGGCA 
TTCGCCATGA CGGGGTTCCG GCTGGGGTAT GCCTGCGGTC CGGAACCGCT TATTTCCGCC 
ATGATGAAAA TTCATCAGTA TTCCATGCTC TGCGCCCCCA TTACTTCCCA GGAGGCGGCC 
ATTGAAGCAT TGGAAAACGG GACATCCGCC ATGTTGAAGA TGCGGGAAAG CTACCGCCAG 
CGCCGGGATT ACCTGGTGAA GCGCCTTAAT GAAATCGGCA TGGACTGCCA CCTGCCCGGC 
GGCGCGTTCT ATGTCTTCCC GGACATTTCC AGATTTGGCT TGACCAGCAA GGAGTTTGCC 
ACCCGGCTGC TGATGGAAAA GCAGGTGGCC GCCGTACCGG GGACCGCCTT CGGCGCAAGC 
GGAGAAGGCT TCCTGCGCTG TTGCTATGCG ACCGCCTTTG ACCAGATCAA GGAGGCCTGC 
AACCGCATGG AACATTTCGT GGAAACTCTT TCCTGA

Protein sequence

MIMNWQNKIA EQVSSIPRSG IREFFDLVTG RTDIISLGVG EPDFVTPWNI REAAIYSLEK 
GHTSYTSNYG LESLRRSIVK YVDGFFHVNY DPLREVLVTV GVSEAIDLAL RAILNPGDEV 
LYHEPCYVSY APSVNMAYGV ATAVPTSKRD LFALNPELLE ASITPRTKVL MLNFPTNPTG 
AVAPVETLQE IARICIRHDL IVLTDEIYSE LRYDGKPHVS IASLPGMKER TLLLHGFSKA 
FAMTGFRLGY ACGPEPLISA MMKIHQYSML CAPITSQEAA IEALENGTSA MLKMRESYRQ 
RRDYLVKRLN EIGMDCHLPG GAFYVFPDIS RFGLTSKEFA TRLLMEKQVA AVPGTAFGAS 
GEGFLRCCYA TAFDQIKEAC NRMEHFVETL S