Gene Amuc_0840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0840
Symbol
ID	6274329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	998943
End bp	1000622
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	58%
IMG OID	642612895
Product	sulfate transporter
Protein accession	YP_001877454
Protein GI	187735342
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00377] anti-anti-sigma factor [TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAAAC CTGCTCTTCT TTCCTCTCTC AAAACTTATA CCAAACAAAC CTTTCTGGCG 
GACCTTTTTG CGGGACTGAC CGTCGGTGTA GTAGCCATTC CGCTGGCCAT GGCCTTTGCC 
ATCGCATGCG GACTCTCCCC AACCCAGGGC CTCATCACCG CCATTGTGGC CGGGTTCCTC 
ATCTCCCTGT TCAGCGGAAG CAAATATCAA ATAGGCGGCC CCACCGGAGC CTTCGTGATC 
ATTATCATGG GCGTCCTGGA GCAATACCAC GCATCCGGTC TGCTGGTCTG CACATTGATG 
GCGGGCCTCT TCCTCATCAT CTTTGGGTTC TGCCGCATGG GGGCGCTCAT CCGCTTTATT 
CCATTCCCTG TCACCACAGG GTTCACCTCC GGCATCGCCG TGGTAATCTT TTCCACGCAA 
ATTAAAGACA TCTTCGGCCT CACCATCACG GAAAAAATTC CCGGAGAGTT CATTGAAAAA 
TGGGCGTGTT ACTTCCATTA CTTCCACACC ATCAACTGGG CGGCGCTGGG GCTGGCCGCC 
GGCACCGTAA TCATTACCCT GCTGAGCCGC CGCTTCTGGC CCAGAATACC GGCCATGCTA 
GTGGGCATGC TGGGCATGAC GGCCGTTTCC GTGGCGTTTT CGTTGCCTGT GACAACCATC 
GGGCAAGCCT TCGGCAGCCT CCCGAATACA CTCCCCCTGC CCTCCCTGCC CAGCATTGAC 
TGGAGTACCC TGGGGGCGCT GACGGCCCCT GCTTTCACCA TCGCGCTGCT GGCGGCGATC 
GAATCCCTGT TAAGCGCCTC CGTGGCGGAC GGCATGACCG GAGGGCGCCA CAAGCCCAAC 
ATGGAGCTGA TTGCACAAGG CATCGGCAAC ATCGGCTCCG CCCTGTTTGG CGGCATTCCG 
GCCACCGGAG CCATTGCCCG CACCGCCACT AACATCAAGG CTGGAGCTAA AAGCCCGGTT 
TCCGGCATGA TTCACGCCCT GACCCTGCTA GCCATTCTGA TGGCCTTTGC CCACTATGCC 
CAGCAGATTC CCCTGGCTGT CCTGGCGGGC ATTCTGACGG TAGTGTGCTA CAACATGAGT 
GAAATACACA CGTTCAGCCG TCTGCTGAAA GGGCCCAGGC AGGATGCGGC GGTGCTGGTA 
ATCACCTTCC TGCTGACCGT GTTTGTGGAC CTCGTTGTAG CCGTGGAAGT AGGCGTGGTG 
CTGGCCGCCC TGCTCTTCAT GGGCCGCATG GCCCAAATCA GCGATGTTTC CGCCATCAAA 
AACGAACTGC TGGAAAATGA TGAGGAAGAT GATGGAAACC GCTCTGCCGC CAAGCTGGAC 
ATCCCGGAAG GTGTGGAAGT TTTCGACGTG AAAGGTCCCT TCTTCTTCGG TGCCGTGGAG 
CAATTCAAGG ACCAGGTGCT GGAAACGCTG GAACATGATA CCAAGGTGGT TATCCTGCGC 
ATGCGCCTGG TTCCCGCGCT GGACGCCACC GGCCTGAACG TCCTTTCCGA CTTCTGCCAC 
CAGTGCCGGG AACACGGTTC CACCCTGCTG GTTTGCGGCG TGCAGCCCCA GCCTCTGGAC 
GTCATCCGCC ACGCGCCCTT TTACCGGGAG CTGAAACGCT ACAATATCTG CGAGAATATT 
GACGCCGCCC TGAACCGGGC CTGCAAAATC ATCAACGGCC CTGCGCCCAA ACACCTGTAA

Protein sequence

MFKPALLSSL KTYTKQTFLA DLFAGLTVGV VAIPLAMAFA IACGLSPTQG LITAIVAGFL 
ISLFSGSKYQ IGGPTGAFVI IIMGVLEQYH ASGLLVCTLM AGLFLIIFGF CRMGALIRFI 
PFPVTTGFTS GIAVVIFSTQ IKDIFGLTIT EKIPGEFIEK WACYFHYFHT INWAALGLAA 
GTVIITLLSR RFWPRIPAML VGMLGMTAVS VAFSLPVTTI GQAFGSLPNT LPLPSLPSID 
WSTLGALTAP AFTIALLAAI ESLLSASVAD GMTGGRHKPN MELIAQGIGN IGSALFGGIP 
ATGAIARTAT NIKAGAKSPV SGMIHALTLL AILMAFAHYA QQIPLAVLAG ILTVVCYNMS 
EIHTFSRLLK GPRQDAAVLV ITFLLTVFVD LVVAVEVGVV LAALLFMGRM AQISDVSAIK 
NELLENDEED DGNRSAAKLD IPEGVEVFDV KGPFFFGAVE QFKDQVLETL EHDTKVVILR 
MRLVPALDAT GLNVLSDFCH QCREHGSTLL VCGVQPQPLD VIRHAPFYRE LKRYNICENI 
DAALNRACKI INGPAPKHL