Gene Caci_4192 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4192
Symbol
ID	8335546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	4746271
End bp	4747287
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	69%
IMG OID	644957295
Product	aldo/keto reductase
Protein accession	YP_003114897
Protein GI	256393333
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.957663
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.276407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATACA CGACCTTCGG GAACACCGGC CTGCGCGTTT CAGAGGCCTT CCTCGGCACG 
ATGGGCTTCG GCGAGGACTG GGGCTGGGGC GTCTCCGTCG AGGACTGCCG GAAGATCTTC 
ACCGCCTACG CCGAGGCCGG CGGCAACGTC ATAGACACCG CGAACCGCTA CACCGACGGC 
TCCAGCGAGC GCATCGTCGG CGAACTGCTC GGCACGGACC GCGACCGCTT CGTCCTGGCA 
ACGAAATACA CCCTGAGCAT GGACGACACC GACCCCAACG CTGCGGGCAA CCACCGCAAG 
AACCTGCGAC GCTCGGTCGA GGACAGCCTG AGCCGCCTGA ACACCGACTA CCTGGACGTG 
CTCTGGGTCC ACATCTGGGA CGCGCACACC CCGCTGGAGG AGACCATGCG CGCCCTGGAC 
GACCTCGTCC GCTCCGGCAA GGTCCTCTAC CTCGGCCTGT CCGACGCCCC CGCCTGGGTC 
GCCGCCCGTG CCCAGACCAT GGCCGAACTC CGCGGCTGGA CCCCCTTCGC AGGCCTGCAA 
CTCAACTACA GCCTGCTGGA ACGCGGCATC GAGCGCGAAC TCCTGCCCAT GGCCGAATCC 
CTGAACCTCT CAGTCGCCGC CTGGGCACCC CTGGCCCGCG GCGTCCTCAC CGGCAAGTTC 
ACCCGCCACG GCGCCACCGA AGGCTCTCGC ACCAGCCGCG ACAAACTGAC TGAGCACGAC 
CTGCACATCG CCGCCACCCT CGACGCGGTA GCCGACGACC TCGGCATCAC TTCCTCCCAA 
GCCGCCGTGG CTTGGACCCG CGCCCACCAC CGCTGGATCC ACCCCATCAT CGGCGCCCGC 
ACCGTCGACC AGCTGAACGA CAGCGTCGCA GCCCTCGACG TCCGCCTCCC CGCCGACGCG 
GTGCGGCGCC TGGAGGAAGC GACGTCGTTC GACCTCGGCT TCCCCCAGGA ATTCATCGCC 
GAGGCACGGG AGTTCGTCTA CGGACCGGGC ATCGAGCGGT TCGAGCCGCG CCGGTGA

Protein sequence

MRYTTFGNTG LRVSEAFLGT MGFGEDWGWG VSVEDCRKIF TAYAEAGGNV IDTANRYTDG 
SSERIVGELL GTDRDRFVLA TKYTLSMDDT DPNAAGNHRK NLRRSVEDSL SRLNTDYLDV 
LWVHIWDAHT PLEETMRALD DLVRSGKVLY LGLSDAPAWV AARAQTMAEL RGWTPFAGLQ 
LNYSLLERGI ERELLPMAES LNLSVAAWAP LARGVLTGKF TRHGATEGSR TSRDKLTEHD 
LHIAATLDAV ADDLGITSSQ AAVAWTRAHH RWIHPIIGAR TVDQLNDSVA ALDVRLPADA 
VRRLEEATSF DLGFPQEFIA EAREFVYGPG IERFEPRR