Gene Amuc_1067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1067
Symbol
ID	6274043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1273673
End bp	1274590
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	60%
IMG OID	642613118
Product	transcriptional regulator, ArsR family
Protein accession	YP_001877674
Protein GI	187735562
COG category	[H] Coenzyme transport and metabolism [K] Transcription
COG ID	[COG0640] Predicted transcriptional regulators [COG2226] Methylase involved in ubiquinone/menaquinone biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.420275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTCAA CCCTAAAAAC GCTCAAACTC CTGGCAGATC CCACCCGCCT GCGCATCATC 
AACGTTCTGA ATGAAGAATC CCTGAGCGTC GCGGAACTTC AGGAAATTCT CGGCATGGGG 
CAAAGCCGCA TCTCCACCCA GCTGGCCCAG CTCCGGCAGG AAGGGGTGGT GGAGGACGCC 
CGTTCCGGCA AAAATGTCTT TTACACTCTT TCCCTGGCAG GCGATCTGCA CAACGTAGCC 
CTGAAAGCCT GCGAGGAATT GCCGGAGGCG GAAACGGACC AAAAAGCCCT TCAGGTTATC 
CTGGACAAGC GCAAAAACCG CACCCAGGCC TATTTTGACG AAGTAGTGTG CCGTCTGGGC 
AAGAACTACG CGCCAGGCCG TTCCTGGAAA GCGCTGGCCG GAGCACTGCT CCGCATTCTG 
AACTATGACG TAGTGGCGGA CCTGGGAGCC GGGGAAGGTT TCGTTTCCCA GCTCATCTCC 
CCCAGCGCCA AACAGGTGAT CGCCGTGGAT AACTCCCCCA GCATGGTGGA GCTGGGGCAG 
GAGCTGGCGC GCAAACACGG GCTGGACAAT CTGGAATACC GCCTGGGCGA CATCGAAGCG 
CCGCCCATTA AACCCGGCAC GGTGGATCTG GCCCTGCTCA GCCAGGCCCT GCACCATGCG 
CAAAAACCGT CCAGAGCGCT GGAAGCTGCG TGGGATATCC TGAAATCCGG CGGTTGCCTG 
GTGGTGCTGG ATCTGCTCCA GCATGGACAG GAGGAAGCCC GTGAACTTTA CGCGGACCGC 
TGGCTGGGCT TCACGCCCGC CGCCCTGGAA AGCATGCTGA AGGAAGCGGG ATTCCGGAAC 
ATCCACACGG ATATTGTGGA CAGGGAGCCG GACCCGCCCC ATTTCCAGAC TCTGATGGCC 
GCCGCCTGGA AACCCTGA

Protein sequence

MKSTLKTLKL LADPTRLRII NVLNEESLSV AELQEILGMG QSRISTQLAQ LRQEGVVEDA 
RSGKNVFYTL SLAGDLHNVA LKACEELPEA ETDQKALQVI LDKRKNRTQA YFDEVVCRLG 
KNYAPGRSWK ALAGALLRIL NYDVVADLGA GEGFVSQLIS PSAKQVIAVD NSPSMVELGQ 
ELARKHGLDN LEYRLGDIEA PPIKPGTVDL ALLSQALHHA QKPSRALEAA WDILKSGGCL 
VVLDLLQHGQ EEARELYADR WLGFTPAALE SMLKEAGFRN IHTDIVDREP DPPHFQTLMA 
AAWKP