Gene Amuc_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0467
Symbol
ID	6274782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	555713
End bp	557056
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	51%
IMG OID	642612517
Product	protein of unknown function DUF344
Protein accession	YP_001877086
Protein GI	187734974
COG category	[L] Replication, recombination and repair [R] General function prediction only [S] Function unknown
COG ID	[COG0494] NTP pyrophosphohydrolases including oxidative damage repair enzymes [COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACCC CCCCCACAGC AAAAAACTGG AGACTCAACG CAGCAGCCAT CATCATGGAC 
GCTGAAGGCT GCGTATTGCT GGGCAAGGAC AGCGGCCGCA ACCCGTACTG GCACTTTCCG 
CAGGGAGGCG TCATTAAACA CGAAAGCATT GAACAGACTC TTGCGCGGGA GGTATGGGAG 
GAAGTGGGCC TGCGCCCCAC GGAATACACC ATTGTCAGCC GCCTGTCCGG CCTGCGTTAC 
AAATACCCTT CCGGCAACCG TAAAGTTACG CGCTGGATAG GCCAGGAACA AACCTACTTT 
CTTGTGCGCT GCAAAACCAG GCGCCCTAAA ACGGATTTGC ACCGCAGCCC CGAATTTTCA 
AAAACGAAAT GGATTCCCCT CCAGAATCTC AAACTGGAAA TGTTCCCCAA ATTCAAAAGG 
AAAGTCATCA AAAACGCCCT TCAGCAATTC TTCGGGCCCG GCTTTCCTTC CAAACACGCC 
GCTGTGAAAA CATCTTCCCC CTCCTCACCC TCATCTTCAA CACTAACTTC GCGTACGATG 
AACCGTTACC TGGTGCCTCC GGGCAAAAAA CTGCGTTTAA AGGATTATTC TCCGGATGAC 
AAATCTCTCT TCTCCGGAAC CAAGGAAGAA TCCCTGATTG AATTCGACAA ACTGAGGGAA 
GAACTGCAGG AACTGCAAAA AAAACTTTTT GCTCAGCACA AGCACAAAAT TCTGGTTATT 
CTTCAGGCCA TGGATGCAGG AGGCAAGGAC GGCTGCGTCA AGCATGTCTT CTCCCGGGTG 
GATCCGCAGG GGCTGCACGT AGTCCCCTTC AAAAAACCCA CTACTGAGGA ACTGGACCAC 
GATTTCCTGT GGCGCGTTCA CAAGGAGGTC CCCGCCAAAG GGCAGATCGC CATCTTCAAC 
CGTTCCCATT ACGAAGATAT CATTGCCGTC CGCGTGAAAA AAATCTTCCC GGACCCAGTC 
TGGAAACGCC GCTACAAGCA CGTCCTCGAC TTTGAAGCCA TGCTTGCGGA AGAAGGCACC 
GTCATCATCA AGCTATTCCT GAATATCTCC AAGGCGGAAC AGAAAAAACG GCTGGAATCC 
AGACTTCAGG ACCCGGATAA ACTTTGGAAA TTCTGCATGG ATGACCTGGA TGACCGAAAT 
CGTTGGGATG AATTCCAGAC AGCCTACCAG GATCTCATTG AAAAAACATC TACTCCGGAA 
GCTCCCTGGT ACATTATCCC GGCAGACCGG AAATGGTACA GAAATCTGGT TGTCGCCCGC 
CTGATGGTAG AAAAACTGCG CCATCTCCAG CTTTCGCTCC CCACTCCCAA CTTTGATCCA 
GCCTCCATCA TCATTCCAGA TTGA

Protein sequence

MDTPPTAKNW RLNAAAIIMD AEGCVLLGKD SGRNPYWHFP QGGVIKHESI EQTLAREVWE 
EVGLRPTEYT IVSRLSGLRY KYPSGNRKVT RWIGQEQTYF LVRCKTRRPK TDLHRSPEFS 
KTKWIPLQNL KLEMFPKFKR KVIKNALQQF FGPGFPSKHA AVKTSSPSSP SSSTLTSRTM 
NRYLVPPGKK LRLKDYSPDD KSLFSGTKEE SLIEFDKLRE ELQELQKKLF AQHKHKILVI 
LQAMDAGGKD GCVKHVFSRV DPQGLHVVPF KKPTTEELDH DFLWRVHKEV PAKGQIAIFN 
RSHYEDIIAV RVKKIFPDPV WKRRYKHVLD FEAMLAEEGT VIIKLFLNIS KAEQKKRLES 
RLQDPDKLWK FCMDDLDDRN RWDEFQTAYQ DLIEKTSTPE APWYIIPADR KWYRNLVVAR 
LMVEKLRHLQ LSLPTPNFDP ASIIIPD