Gene Caci_4948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4948
Symbol
ID	8336302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5650237
End bp	5651217
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	70%
IMG OID	644958047
Product	aldo/keto reductase
Protein accession	YP_003115649
Protein GI	256394085
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0576267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGCC GGACGATCGC GGGCACGCTG CTGGCCCTGA CCGAGCTCGG GTTCGGGGGA 
TCGGTCATCG GGAACCTGTA CCGGCCGGTC TCCGACGACG ATGCCGAAGC CGCGGTCGCC 
GCGGCCTGGG ACGCCGGGAT CCGCTCCTTC GACACCGCGC CGCACTACGG ACTCGGGCTG 
TCCGAACGCC GCCTCGGCGC CGTGCTGAGC GACCACCCTC GAGACGAGTA TGTGCTGTCG 
TCCAAAGTCG GGCGGCTGCT CGTCCCCAAC GACTACCCCA CCGGCCGTGA CAGCGACGGT 
TTCGCCGTCC CGGACACAGT CCGCAGGAAG TGGGACTTCA GCAAGGACGG CGTCCTGCGC 
TCCATCGAAG CGAGCCTGGA CCGCCTCGGG ACGGACCGCC TCGACATCGT CTACCTGCAC 
GATCCCGACG ACCACTGGCA GCAGGCCGCC GACGAGGCCA TGCCCACCCT CGCGCAGCTG 
CGCGACGAGG GCGTCGTCGG CGCGATCGGC GCCGGCATGA ACCAGTCCGC GATGCTCACC 
CGCTTCCTGC GGGAGACCGC CGCGGACGTG GTCATGCTGG CCGGCCGGTA CACCCTGCTC 
GACCAGAGCG CCCTGGAGGA CGTGCTGCCG GCCGCGATCG AGCAGGGGAA GAGCGTCGTC 
GCGGTCGGCG TCTTCAACTC CGGTCTGTTG GCGGGCGACC GGCCGGGCGC CGGGATGAAG 
TACGACTACG GCGACGCGCC CGCAGACCTC GTCGACCGCG CCCGGATGAT CGCCGAGGTC 
TGCGAAGCCC ATGGGACGAC GCTGCCCGCC GCGGCCATCG CCTTTCCGTT CACCCACCCC 
GCTGTCGTCA ACGTCACGCT CGGAATGCGG ACCTCTCGGC AGGTGGCGCG CAACATCGAG 
CTCCACCGGT CGAGCGTCCC CCAAGCCTTG TTCGCCTACC TGGGGTCGCT GGGACTGATC 
ACCTACAGCG AAGGATCGTA G

Protein sequence

MNRRTIAGTL LALTELGFGG SVIGNLYRPV SDDDAEAAVA AAWDAGIRSF DTAPHYGLGL 
SERRLGAVLS DHPRDEYVLS SKVGRLLVPN DYPTGRDSDG FAVPDTVRRK WDFSKDGVLR 
SIEASLDRLG TDRLDIVYLH DPDDHWQQAA DEAMPTLAQL RDEGVVGAIG AGMNQSAMLT 
RFLRETAADV VMLAGRYTLL DQSALEDVLP AAIEQGKSVV AVGVFNSGLL AGDRPGAGMK 
YDYGDAPADL VDRARMIAEV CEAHGTTLPA AAIAFPFTHP AVVNVTLGMR TSRQVARNIE 
LHRSSVPQAL FAYLGSLGLI TYSEGS