Gene Amuc_2025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2025
Symbol
ID	6274679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2458357
End bp	2459559
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	58%
IMG OID	642614085
Product	DEAD/DEAH box helicase domain protein
Protein accession	YP_001878616
Protein GI	187736504
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.000222317
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTATTTT CAGAATTAGG TTTATCGGAA CCCGTCTTGA AGGCGGTGGA GAAATGCGGT 
TATGAACATC CCACCCCCAT TCAGGAGCAG GCCATTCCCA TCATTCTGGA AGGCAGGGAC 
CTCATTGGGG CCTCCCAGAC GGGGACGGGG AAAACCGCTG CTTTCGCCCT CCCGCTGCTG 
ACAAGGATTC AGCCCATCGG CAAACCTCAG ATACTGGTGC TGGAACCCAC CAGGGAACTG 
GCCGACCAGG TGGCGGAATC CTTTGCCGAA TACGGTGAAT TCACCGGGTT GAAAGTAGCG 
TTGCTGTATG GCGGCGTGGG GTACGGAAAG CAGACGGAAG ACCTGAAAAA AGGGGCGGAC 
ATCGTTGTGG CCACTCCCGG CCGGCTGGTG GACCACTTCT ACCGCTGCAC CATGCGCTTC 
GGAGAAGTCA AGGCCCTGGT TCTGGATGAA GTGGACCGAA TGCTGGACAT GGGGTTCCTG 
CCCATTGTCC GTAAAATCGT CAACCTTTGT CCGTGGGAAG GAAGGCAAAC CCTCTTCTTC 
TCCGCCACCA TGCCTCCGGT CATCGCGGGA TTTGCCAAAT GGTGCCTGAC GGACCCTGCG 
GAAGTTACCA TCGCCCGGCG TGAAGTGGCC GCCACCATCA GCCATGCCTT TTATCCGGTA 
GCTCTGGACC AGCGGGATGA ACTGCTGTTG GCCCTGCTCA AGGGGACGGA CTTCCGTTCC 
GTCATGATTT TCACCCGCAC CCGCAAGGAG GCGGACGCGG TATGCGGCAT GCTCAAGCAT 
CATGGCTACC GCGGGGAGGT GGCCGTCATG CACTCCGACA TTCCCCAGAA GGAACGCATG 
GAGGCGCTTA AGGGATTCAA GAGCGGAAAA TATGATATTC TGGTGGCTAC GGATGTGGCG 
GCGCGCGGCA TTGACATCAG CGGTGTGACC CACGTCATCA ACTACCGCGT TCCGGAAAAC 
GCGGAAGACT ATGTGCACCG CATCGGCCGT ACCGGCCGCG CGGAAGCTTC CGGGGATGCG 
TTCACGATCA TGACGGCGGA TGAGCTGGAT TTTGCTGCGG CTGTGGAAAA TTTCATTGGG 
AAACCCATTG AACGCAAAAA ACTGGACGGG TTCAACTACA CGTACACCGC CCTGTTGGAA 
GACAAGCCCG TCAAATCCGT CCGCAAGCCC AAACCCGCAG GTCCCAAGCG CCGCAGGCGC 
TAA

Protein sequence

MLFSELGLSE PVLKAVEKCG YEHPTPIQEQ AIPIILEGRD LIGASQTGTG KTAAFALPLL 
TRIQPIGKPQ ILVLEPTREL ADQVAESFAE YGEFTGLKVA LLYGGVGYGK QTEDLKKGAD 
IVVATPGRLV DHFYRCTMRF GEVKALVLDE VDRMLDMGFL PIVRKIVNLC PWEGRQTLFF 
SATMPPVIAG FAKWCLTDPA EVTIARREVA ATISHAFYPV ALDQRDELLL ALLKGTDFRS 
VMIFTRTRKE ADAVCGMLKH HGYRGEVAVM HSDIPQKERM EALKGFKSGK YDILVATDVA 
ARGIDISGVT HVINYRVPEN AEDYVHRIGR TGRAEASGDA FTIMTADELD FAAAVENFIG 
KPIERKKLDG FNYTYTALLE DKPVKSVRKP KPAGPKRRRR