Gene Amuc_1331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1331
Symbol
ID	6275840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1608167
End bp	1609486
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	58%
IMG OID	642613387
Product	major facilitator superfamily MFS_1
Protein accession	YP_001877936
Protein GI	187735824
COG category	[C] Energy production and conversion
COG ID	[COG3202] ATP/ADP translocase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.865021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.03557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGCG GAATGAAGGA ACGCCTGTGC CGGAGCCTGG AAAAGGTGCT GCATGCGGAA 
ACCCGCGAAT TGCCTGCCGC AGCGGGGGGA ATCCTCCTGT TTTTCCTGTT GTTCCTGGCC 
TATTCCATGT TGCGGCCGGT CCGGGAGACG ATGGGCATTG CCGGAGGCGT TCAGAATCTG 
CAGTGGCTTT TTACGGCTAC TTTCGCCGCT TCCATAGGGG GCCAGTTTTT ATTCGGATGG 
ATTTCCTCAA AGGTGCGGAG AAAGGCCATT CTTCCGTGGA CGTACGGTTT TTTCATTCTT 
AACCTGGCGG TTTTTGCGGC GCTTGTGCTG GCATGCCCGG GAAATGTCTG GACGGCCCGT 
TTGTTTTATG TGTGGCTGTC CGTATTTAAC CTGCTTACCG TTTCCGTGGC GTGGAGCGTG 
CTGTCGGACG TCATGAAGCC GGGGCAGATG AAACGCCTGT TTGCCCTGGT TGCCAGCGGA 
AGCAGCCTTG GGGCCATGGC GGGGCCGGCG GTGACGGCCG CCCTTGCCGG AGTGGCCGGC 
CTTTTGTGGT TGTTCCTTGC CGCCGCTGTT CTTCTGGCGC TGGCGATGCT GGCGGGAATG 
TACCTGCACC GCTGGCGTGA CGGGAATTCC CCGGAAGATG AGGAAACGGG AGTTCTTCTT 
CCGGCCGATT GCCGGGAACG CCCTCTGGGA GGGAACCCGT TTGCCGGGGC GTCTGCCGTA 
TTCCGGTCTC CCTTCCTGAT GAGCATCGGG CTGTTCATCA TCCTGCTGGC CGGGACCAAT 
ACGTTCCTGT ATTTTGAGCT GATGAGCGTT GTAGCGTCTT CCTTTCCTGA TCCGGTGCGC 
CAGACGCAGG TATTCGGAGT GCTGGACGTT GTTGTTCAGG GGTGTACCAT GCTGCTTCAG 
GTATTTCTGG CGGGACGCAT TGTTCGGAAA TTCGGATTGG CGGCGCTGCT GGCGGCTGTC 
CCCGTTCTTA TTTCCCTGGG TTTTGTATGG ATGGCTTTCG CTCCGGTATT TGCCGTCGTG 
GCCGTGGTGA TGGCGGTACG CCGCATCGGG GAATACGGAA TGGTGCGTCC CGGCCGTGAA 
ATGTTGAATT CCGTATTGTC CCCGGAAGAA AAATATAAAG CCAAGAGCTT TATTGATACG 
GTCCTTTACC GTGGCGGCGA CGCCGTCAGC GCATGGCTGA AAAGCTCCTT TAACGTGTTG 
GGTGCCCATT CCCCGTGGGC CATGCTGGCC GGAGCCGCCA TTTCCTTTCT TTGGGCGGCC 
ACCGGATTCC TGCTTGCGGA CAGGTTCCGG AAAATGGCCG GAGTACAGGG AAAGAAATGA

Protein sequence

MSSGMKERLC RSLEKVLHAE TRELPAAAGG ILLFFLLFLA YSMLRPVRET MGIAGGVQNL 
QWLFTATFAA SIGGQFLFGW ISSKVRRKAI LPWTYGFFIL NLAVFAALVL ACPGNVWTAR 
LFYVWLSVFN LLTVSVAWSV LSDVMKPGQM KRLFALVASG SSLGAMAGPA VTAALAGVAG 
LLWLFLAAAV LLALAMLAGM YLHRWRDGNS PEDEETGVLL PADCRERPLG GNPFAGASAV 
FRSPFLMSIG LFIILLAGTN TFLYFELMSV VASSFPDPVR QTQVFGVLDV VVQGCTMLLQ 
VFLAGRIVRK FGLAALLAAV PVLISLGFVW MAFAPVFAVV AVVMAVRRIG EYGMVRPGRE 
MLNSVLSPEE KYKAKSFIDT VLYRGGDAVS AWLKSSFNVL GAHSPWAMLA GAAISFLWAA 
TGFLLADRFR KMAGVQGKK