Gene Amuc_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0037
Symbol
ID	6275166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	51964
End bp	53448
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	55%
IMG OID	642612078
Product	amino acid permease-associated region
Protein accession	YP_001876665
Protein GI	187734553
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.877998
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGTAT TCACTCTCGC CATGATCAAC GTTTCCGCCA TTGTCAGCCT GCGCGGCATG 
CCTGCGGAAA GCACTTACGG ACTGAGTTCC GTTTTTTATT ACATTTTCGC CGCGGTATTC 
TTTCTGGTGC CTGTTTCCCT GGTCGCCGCG GAGCTTACTA CCGGATGGCC CCAAAAGGGC 
GGCGTTTACC GCTGGGTAGG CGAGGCATTC GGGAAAAAAT GGGGGTTCCT GGCCATCTGG 
CTGCAATGGA TTGAGAGTAC CATCTGGTTC CCTACCGTTC TGACATTCGC CGCCGTTTCC 
CTGGCTTTCA TGGGGCCCGG ACAAAGATGG GATGAAGCGC TTGCCGCCAA TAAATGGTAT 
GTTCTCATCG TGGTGCTGTG CGTGTACTGG GCGGCCACCC TGCTTAATCT GCGCGGCATG 
AAGACTTCCG CAGGCGTCAC CAAATGGGGA ACCATCATCG GAACCATTAT TCCCGGAGCC 
ATCCTGATCC TGCTGGGCCT GGGCTATTGG GCCGGCGGCA ACCCGATCCT GCTGGATATG 
AGCTGGGACA AGCTGGTGCC GGACATGAGC AATTTCAACA ACCTCGTTCT GGCAGCCAGC 
ATCTTCCTGT TTTACGCGGG GATGGAAATG TCCGCCGTGC ATGTGAAGGA TGTGAATAAT 
CCCGGACGCA ATTATCCGCT GGCCATTCTG ATTTCCGCCA TCATTACGGT GCTTATTTTC 
GTTCTAGGCA CGCTGGCCAT CGGCTTCATC ATTCCCAATT CCCAGATTAA TCTGGTGCAG 
AGCCTGCTGA TTACTTATGA CAGCTATTTC AGCTTCTTCG GCCTCGGCTG GATGAACTGG 
ATTCTGGCGC TTGCGCTGGC CGTCGGCGTT CTGGCCCAGG TAACCGCATG GGTGGGAGGC 
CCCTCAAAAG GCCTGTACCA AGTGGGCCTG GCCGGCAACC TTCCGCCTGT CATGCAGAAG 
CGGAACAAGA ACAACGTCCA GATGGGCATC CTTTTTATCC AGGGGGGAAT CGTCACCCTG 
CTTTCCATCA TGTTTGTGAT CATGCCTTCC GTGCAATCCG CCTACCAGAT TATTTCCCAG 
CTGACCATCA TTCTGTACCT CATCATGTAC ATGCTGATGT TCGCGTCAGG CATTTACCTG 
CGCTACCGGG AACCGAATAC GCCCCGTACT TTCCGCATTC CCGGCGGCAG AACCTTCGGC 
ATGTGGATTG TCGGAGGGCT CGGCTTCCTG GCCAGCCTGG CGGCTTTCCT GGTGAGCTTC 
ATCCCGCCTA ACCAAATTAC CGTAGGCAGC AGTACCATGT ACATTCTCCT TCTGGTGGTG 
GGTACCTTCA TTTTCGCGGG TATTCCCTTT ATCATCCATG CCATGGCCAA ACCCTCCTGG 
AAACGGCCGG TGGATCCCGA AGACGCCTTT GAACCCTTCG GATGGGAGAA AAACAATGAT 
TCCCATTCCG CAGCAACCCC TAGCCATTCC ATATCCCATG AGTGA

Protein sequence

MGVFTLAMIN VSAIVSLRGM PAESTYGLSS VFYYIFAAVF FLVPVSLVAA ELTTGWPQKG 
GVYRWVGEAF GKKWGFLAIW LQWIESTIWF PTVLTFAAVS LAFMGPGQRW DEALAANKWY 
VLIVVLCVYW AATLLNLRGM KTSAGVTKWG TIIGTIIPGA ILILLGLGYW AGGNPILLDM 
SWDKLVPDMS NFNNLVLAAS IFLFYAGMEM SAVHVKDVNN PGRNYPLAIL ISAIITVLIF 
VLGTLAIGFI IPNSQINLVQ SLLITYDSYF SFFGLGWMNW ILALALAVGV LAQVTAWVGG 
PSKGLYQVGL AGNLPPVMQK RNKNNVQMGI LFIQGGIVTL LSIMFVIMPS VQSAYQIISQ 
LTIILYLIMY MLMFASGIYL RYREPNTPRT FRIPGGRTFG MWIVGGLGFL ASLAAFLVSF 
IPPNQITVGS STMYILLLVV GTFIFAGIPF IIHAMAKPSW KRPVDPEDAF EPFGWEKNND 
SHSAATPSHS ISHE