Gene Caci_1417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1417
Symbol
ID	8332756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	1613593
End bp	1614642
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	644954565
Product	aldo/keto reductase
Protein accession	YP_003112181
Protein GI	256390617
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.479026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0673448
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATACC GGCGGCTGGG TGACTCGGGG CTCGTCGTGC CCGCTTTAAG CTTCGGGGCG 
GGCACGTTCG GCGGGAAGGG GGCGCTGTTC AGCGCGTGGG GCGACACCGA CGCGCGCGAG 
GCGCGGCGGC TGATCGACGT CAGTCTCGAC GCCGGGGTGA CGATGTTCGA CACCGCGGAC 
GTCTACTCCG ACGGGGCGTC CGAGGAGGTC CTCGGCGCGG CGATCAAGGG CCGGCGGGAT 
CAGGTACTGC TGTCGACCAA GGCCGGGCTG CCGGTCGGCG ACGGACCACA AGACGCGGGC 
ACATCGCGTT CGCGGCTGGT CAAGGCGACG GAGAGCGCAC TGCGCCGACT CGGCACCGAC 
TACATCGATC TGTTCCAGCT ACACGCCTTC GACGCCCGCA CCCCGGTTGA CGAGACGATC 
TCAGCCCTCG ACGATCTGGT CCGCCAGGGC AAGATCCGCT ACGTCGGCGC GTCCAACTAC 
TCAGGCTGGC AGCTGATGAA GTCACTGGCG GCAGCCGACC GCCTGCACGC CCCACGCTAC 
GTGGCGCACC AGGTCTACTA CTCGCTCGTG GGGCGCGACT ACGAGTGGGA ACTGATGCCG 
CTCGCCGCCG ATCAGGGCGT CGGCGCGCTG GTCTGGAGCC CGCTGGGATG GGGACGGCTG 
ACCGGTCGGA TCCGGCGCGG GCAGGCGCTC CCAGCGGGAA GCCGACTGCA TCAGACTGCT 
GACTTCGGCC CGCCGGTCGA CAACGAGTTG CTGTACGACG TGGTCGACGT CCTGGACCAG 
ATCGCCGAGG AGACCGGCAA GGCGGTACCG CAGATCGCCA TCAACTGGCT CCTGCGCCGG 
CCAACCGTCG CCTCAGTCAT CATCGGCGCC CGCAACGAGG AGCAGCTACA GCAGAACCTC 
GGCGCCATCG GCTGGGAACT GACGGCGGAG CAGGTCGCGC GACTGGACGC GGCAAGCGGG 
AAGGAGGCGC CGTATCCGTA CTTTCCTTAC GAGCGACAGG AGGCTTTCGC CCGGTTGAAC 
CCGCCGATGT TTGGCAGCGC TCGGCTGTAG

Protein sequence

MEYRRLGDSG LVVPALSFGA GTFGGKGALF SAWGDTDARE ARRLIDVSLD AGVTMFDTAD 
VYSDGASEEV LGAAIKGRRD QVLLSTKAGL PVGDGPQDAG TSRSRLVKAT ESALRRLGTD 
YIDLFQLHAF DARTPVDETI SALDDLVRQG KIRYVGASNY SGWQLMKSLA AADRLHAPRY 
VAHQVYYSLV GRDYEWELMP LAADQGVGAL VWSPLGWGRL TGRIRRGQAL PAGSRLHQTA 
DFGPPVDNEL LYDVVDVLDQ IAEETGKAVP QIAINWLLRR PTVASVIIGA RNEEQLQQNL 
GAIGWELTAE QVARLDAASG KEAPYPYFPY ERQEAFARLN PPMFGSARL