Gene Amuc_1852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1852
Symbol
ID	6273724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2251566
End bp	2252543
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	59%
IMG OID	642613913
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001878447
Protein GI	187736335
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC CCCTGTTGGA AATCAAGAAC CTGGTCACCG GCTTCGAAAC GGAATCCGGC 
CTGTTGAAAG CGGTGGACGG CGTCAGCTTC ACCGTCCCCA AAGGTACCTG CGTAGGCATC 
GTAGGGGAAT CAGGCTGCGG CAAAAGCGTT ACGGCCATGT CCATCGTCCG GCTGCTGCCC 
CAGCCCATGG GGAAAATTTT GGACGGGCAA ATTCTGTTCA AGGGCCGCGA CCTGGTTCAG 
GCAAAAGAGA CGGACATGCA CGGCATCCGC GGCCGCCATA TCGGCGTCAT TTTCCAGGAA 
CCAATGACGG CGCTCAATCC CGTACACAGC ATCGGCAGGC AAATTGGGGA ATCCCTGATG 
CTCCACCGGG GAATGAACAC CAGGGAAGCC CGGGACGCAG CCATCCAGCT CCTGCAGCGC 
GTTCGTATCC CCGCCCCGGA ACAGCGTGTG GACGAATTTC CTCATCAGCT CTCCGGCGGC 
ATGCGCCAGC GCGTCGTCAT AGCCATTGCC CTGGCCTGCC ATCCGGAACT CATCATTGCG 
GATGAACCTA CTACGGCCCT GGATGTCACC GTTCAGGCTC AAATCCTGTC CCTGCTCAAA 
GACCTTCAGG CGGAAATGGG GTCATCCTCC ATCCTCATTA CACATGACCT GGGCGTCATC 
GCACAGAGCT GTGACTCCGT AGTCGTCATG TACGCTGGCC GCGTGGTGGA AAAGGCCCCT 
GTCCGGGAAC TTTTTGCCAA CCCCCGCCAT GCTTACACCA AGGGACTGCT GGCCTCCATC 
CCTCAGCTAA GTTCCGTGCG GAAAACCAAA CTGCCCACCA TTCCCGGTCA GGTGGCCTCT 
ATTGCGGATT TTGTTCCCGG ATGCCGCTTC TGCCAAAGGC AGGGTGTGCC CGCGGAAGAA 
CTCACGGAAC GCCCTCCCCT CGTGGAAATA TCCCCGGACC ACTTCGTGGA AGCCTGCCCC 
CGTTGCGCCA ACCTTTAA

Protein sequence

MSDPLLEIKN LVTGFETESG LLKAVDGVSF TVPKGTCVGI VGESGCGKSV TAMSIVRLLP 
QPMGKILDGQ ILFKGRDLVQ AKETDMHGIR GRHIGVIFQE PMTALNPVHS IGRQIGESLM 
LHRGMNTREA RDAAIQLLQR VRIPAPEQRV DEFPHQLSGG MRQRVVIAIA LACHPELIIA 
DEPTTALDVT VQAQILSLLK DLQAEMGSSS ILITHDLGVI AQSCDSVVVM YAGRVVEKAP 
VRELFANPRH AYTKGLLASI PQLSSVRKTK LPTIPGQVAS IADFVPGCRF CQRQGVPAEE 
LTERPPLVEI SPDHFVEACP RCANL