Gene Caci_6362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6362
Symbol
ID	8337725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	7317608
End bp	7318675
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	72%
IMG OID	644959463
Product	1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D- glucopyranoside deacetylase
Protein accession	YP_003117057
Protein GI	256395493
COG category	[S] Function unknown
COG ID	[COG2120] Uncharacterized proteins, LmbE homologs
TIGRFAM ID	[TIGR03445] 1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D-glucopyranoside deacetylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.797199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.473152
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTC CCCTGGACCT GCTGGACATG CCGTTCGCGC GCCTCGGCGA CCGCCTCGGC 
AACCCGCTCA GGCTGCTGAT GGTGCACGCG CATCCGGACG ACGAGACCAC CACCACCGGC 
GCCACCGCCG CGCTGTACGC CGCCGAGACC ATCGACGTGT ACCTGGTGAC CTGCACCCGG 
GGCGAGCGCG GCGAGATCCT GGACCCGGAG GCCCAGCGCG TGGTGGACGA CGCCGCCGAC 
GGGGAGCAGG CGCTGGGCGA ACTACGGGTG CGAGAACTGG CCGGCGCCGT CACCATGCTC 
GGGATCAAGG GGTCGCGCTT CCTCGGCGGA GCGGGCCGCT GGTGGGATTC GGGGATGGCC 
GGCGAGGAGT CCAACACCGA CCCGCGCTCG CTCGTGGCCG GGGACTTCCA GGAGCAGGTC 
GACGCGTTGG CCGCGGCGAT CCGCGAGATA CGGCCTCAGG TTCTGGTCAC CTATGACTCG 
CGCGGCGGCT ACGGGCACCC CGACCACATC CGCGCGCACC AGCTGAGCCT GGCCGCCGTC 
GACCGCGCGG CCGAGACCGG CGGCGAGAGC GAGAGCGGCG GCGAGGGCGG CGGCGAGGGC 
GCGGAGGCCT GGAGCGTCGC GAAGGTCTAC GCGGCCGTCG TCCCGTTCAG CATTCTGCGT 
TCGGTCGCGC GCCGCCTGGG CTCCAACGGC GACAGCCCCT TCGCCCCGCT CGCCGAGGCC 
TTGGCCAACG GCGTGCCGGA GGACCTCATC GAGATCCCGT ACGGCGTCCC CGACCACCTG 
GTGACCGCCC AGATCGACGC CCGGGACTGG CTGGACGCCA AGACCGCCGC CATGCGCTCG 
CACCGTTCCC AGATGGCCGC CGACAGCTGG TTCTTCAAGC TCGCGGCGAG CTCCGACGGC 
GGATTCGGCA TCGAGCACTT CCAGCTGCTG CGCGGCACGG CCGGGCCGTT GGACGACGGT 
TTCGAGGCCG ACCTGTTCGC CGGCGTGCGG GCGGTCGACG ACTCCGATTG CGAACCCGAC 
TTCGGATGGC TGCCCGAAGA GGAGCCGGCC GGCGGCGAGC TGTTCTGA

Protein sequence

MTLPLDLLDM PFARLGDRLG NPLRLLMVHA HPDDETTTTG ATAALYAAET IDVYLVTCTR 
GERGEILDPE AQRVVDDAAD GEQALGELRV RELAGAVTML GIKGSRFLGG AGRWWDSGMA 
GEESNTDPRS LVAGDFQEQV DALAAAIREI RPQVLVTYDS RGGYGHPDHI RAHQLSLAAV 
DRAAETGGES ESGGEGGGEG AEAWSVAKVY AAVVPFSILR SVARRLGSNG DSPFAPLAEA 
LANGVPEDLI EIPYGVPDHL VTAQIDARDW LDAKTAAMRS HRSQMAADSW FFKLAASSDG 
GFGIEHFQLL RGTAGPLDDG FEADLFAGVR AVDDSDCEPD FGWLPEEEPA GGELF