Gene Amuc_0783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0783
Symbol
ID	6274400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	918736
End bp	920031
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	53%
IMG OID	642612833
Product	phosphoadenosine phosphosulfate reductase
Protein accession	YP_001877398
Protein GI	187735286
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAACAT ATCTGGATAA AAATGTTTAT GAGGCGGCTT TAGAACGCAT AGCCTATTGT 
TTCCAAGAGT TTGACAATGT CCTGGTGTCT TTTTCGGGCG GCAAGGACAG CGGCGTCATG 
CTTAATCTCT GCTATCGTTA CGCCGCCGAA CAGGGCCTTC TGGATAAGCT GTCCATGTAT 
CACCTTGATT ATGAGGCCCA ATATCAGATG ACGACCGAGT ATGTCACCAG AACATTTCTG 
GAGCAATTCC CCGGCATTCG TAAGATGTGG TACTGTGTAC CGATCAGGGC CCAGTCCGCA 
TGCTCCCTGG GGGAACCTTA CTGGACGCCG TGGAGCGCCG CCCAGAAAAA ACTGTGGGTG 
CGACCCATGC CGGAAAATCC CTATGTAATC AACGAAAAGA ATCTGGACGT CCCGTTCCGG 
CACGGTATGG TGGACTATGA ATTCCAGGAT AAGCTTTCAC GCCATTTTGC CAAAAAACAC 
GGAAGTACTG CCGTCATGGT AGGGCTGCGG GCGGATGAAA GCCTCAACAG ATACGCCGCC 
GTTGCCCGCG GCAATAAAAG GACGTCTTAT GAGGGAAGGA AGTGGATTAC ACGGGCTGAT 
GCCGTGACCG TCAGCGCCTA CCCTCTTTAT GACTGGCGCG TCAGTGACGT CTGGACGGCC 
AACGCCCGTT TTGGTTTTGA CTATAACCGC CTTTACGATC TCCTGTACCA GGCAGGCCTT 
ACGATCGGGC AAATGCGGGT GGCAAGCCCG TTTAATGACT GCGCCCAGGA AAGCCTGAAG 
CTTTACAAAG TTATTGATCC TGCCAACTGG GCGCGCATGG TCGGGCGCGT CAACGGCGTC 
AACTTCACAG GTTTGTACGG AGGTACGACG GCCATGGGCT GGAAAACCAT CAAACTGCCG 
CCCGGCCATA CCTGGAAGTC CTATTATGAA TTCCTGCTTT CCACAATGAA CGAGAAAACG 
GCGGAACACT ACAACAACAT TTTGGAGAGG TCTAAAAAGT ACTGGATGAA AGGGGGTACC 
GTCGATCCCG GAACTGCCGA TGAAGTGCTG GCCGCCTATC CTCTGGCGAC CGTGACGGGA 
AAGTCGGGCC GTTACGTCGA CCGCGACGTC ATTCAGTTTA TGGGCTATCC CGACGACATG 
CCGGTCAGCA ATTTCCGGCA GGTGCCTTCC TACAAGCGCA TGTGCATCTG CATCATGAAG 
AATGATTACT TTTGCAAGTA CGCCGGGTTC GGTCCAACCA AGGGAGCGAT TGCCCGGCGC 
CGGGCCGCCG TCAATAAATA CCGCAATATT TTATGA

Protein sequence

MKTYLDKNVY EAALERIAYC FQEFDNVLVS FSGGKDSGVM LNLCYRYAAE QGLLDKLSMY 
HLDYEAQYQM TTEYVTRTFL EQFPGIRKMW YCVPIRAQSA CSLGEPYWTP WSAAQKKLWV 
RPMPENPYVI NEKNLDVPFR HGMVDYEFQD KLSRHFAKKH GSTAVMVGLR ADESLNRYAA 
VARGNKRTSY EGRKWITRAD AVTVSAYPLY DWRVSDVWTA NARFGFDYNR LYDLLYQAGL 
TIGQMRVASP FNDCAQESLK LYKVIDPANW ARMVGRVNGV NFTGLYGGTT AMGWKTIKLP 
PGHTWKSYYE FLLSTMNEKT AEHYNNILER SKKYWMKGGT VDPGTADEVL AAYPLATVTG 
KSGRYVDRDV IQFMGYPDDM PVSNFRQVPS YKRMCICIMK NDYFCKYAGF GPTKGAIARR 
RAAVNKYRNI L