Gene Caci_4943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4943
Symbol
ID	8336297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5643484
End bp	5644485
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	72%
IMG OID	644958042
Product	aldo/keto reductase
Protein accession	YP_003115644
Protein GI	256394080
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.020989
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCTT CCATACCCAC CGTCCGGCTC GGCTCGGACG GTCCCGCCGT CGGCGCGCAA 
GGGCTCGGCT GCATGGGGAT GAGCGAGTTC TACGGCGACA CCGACCAGGA CTCGGCCCGC 
CAGACCCTCG AGGCCGCCCT GTCCGCCGGT GTCACCTTGT TCGACACCGC CGACATGTAC 
GGCCGGGGCG AGAACGAACG CTTCCTCGCC CCGTTCCTCC GCGCCCACCG GGACCACGTC 
GTCATCGCCA CCAAGTTCGG CAGCGTCCGC GCCGCCGACG GGCCGATGTC GGTCAGCAAC 
GACCCCGCCC ACATCCGCCG CGCCGTCGAG GCCAGCCTGA CGCGGCTGGG CATCGAGGTC 
ATCGACCTCT ACTACATGCA CCGCCGCGAC CCCGCGGTCC CGCTGGCCGA CTCCGTCGGA 
GCGATGGCCG ACCTCGTCCA CGCCGGCAAA GTCCGCCACC TGGGCCTGTC CGAGGTCACC 
GCCGACGAAC TGCGCGAGGC CCACAGCCAC CATCCGATCA GCGCGGTGCA GGCGGAGTGG 
TCCCTGTTCA CCCGGGACAT CGAACGCAGC CTCGTACCCG CCGCCGCCGA ACTCGGCGTC 
GGCGTGGTCG CCTACTCCCC CCTCGGCCGC GGCTTCCTCA CCGGCGCTGT GCCCAGCACC 
TTGGCCGCCG ACGACGTGCG CACCCGATTC CCCCGCTTCA CCGGCGAGAA CGCCGAGCGC 
AACGCGGCGC TCCTGCCCCC GATCACCTCG ATCGCCGCCG CCCGCGGCGC CACACCCGCG 
CAGGTCGCGT TGGCGTGGCT GCACCAGCGG CGCGCCACAC ACCGCCTCCC CGTCGTGCCG 
ATCCCCGGCA CCCGGCACCC GCACCGCTTG AAGGAGAACC TCGCCGCCCT CGAACTCACT 
CTCACCGCTG AGGAACTCGC ACGCCTGGAA CCCCTCGCCG CGCACGTCGC CGGCGACCGG 
TACCCCGACA TGGCCGAGAC GTCCAACGCC CGCGAAGCCT GA

Protein sequence

MSPSIPTVRL GSDGPAVGAQ GLGCMGMSEF YGDTDQDSAR QTLEAALSAG VTLFDTADMY 
GRGENERFLA PFLRAHRDHV VIATKFGSVR AADGPMSVSN DPAHIRRAVE ASLTRLGIEV 
IDLYYMHRRD PAVPLADSVG AMADLVHAGK VRHLGLSEVT ADELREAHSH HPISAVQAEW 
SLFTRDIERS LVPAAAELGV GVVAYSPLGR GFLTGAVPST LAADDVRTRF PRFTGENAER 
NAALLPPITS IAAARGATPA QVALAWLHQR RATHRLPVVP IPGTRHPHRL KENLAALELT 
LTAEELARLE PLAAHVAGDR YPDMAETSNA REA