Gene Caci_3661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3661
Symbol
ID	8335014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4094527
End bp	4095702
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	62%
IMG OID	644956801
Product	Epoxide hydrolase domain protein
Protein accession	YP_003114404
Protein GI	256392840
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.543395
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCAT CGACGTCCGC ATCCTCAGAC TCACCCTCAG ACCTGGTCCG TCCGTTCACC 
GTCGCGATCT CCGACGCCGA GATCGAGGAC CTGAAGCAGC GGCTGGCCAG GACGCGCTGG 
CCGAATCCGG AGACCGTCCC CGACTGGTCG CAGGGAGTCC GCCTGGAGAA CGCCAGATCG 
CTCGTCGACT ACTGGGAGCG AGAATACGAC TGGCGCCGAT TCGAAGCGGA ACTTAATAGT 
TTTCCCCATT TCCTGACCAC GATCGATGGG CTCGACATTC ACTTCATTCA TGTCAAGTCC 
AAGAATCCGA ATGCGATGCC TCTGATCTTG ACGCACGGCT GGCCGGGGTC GATCGTCGAA 
TTCCTGAAAC TGATCGGCCC GCTGACCGAC CCGGTGTCCT TCGGAGGAAC CATCGAAGAT 
TCCTTCGACG TCGTCATCCC GTCGCTGCCC GGGTTTGGGT TCAGTCAAAA GCCGACCGAT 
ACGGGCTGGA CTGTTTCCCG TATCGCAGGC GCGTGGGCGG AACTCATGAA GCGTCTTGGC 
TATACGAGCT GGGCTGCTCA AGGCGGCGAT TGGGGCGCGG TCGTTACTAC CGCCCTCGGA 
GCGATGCAGC CTGAGGGCCT TCTCGGGATT CACTTGAACA CTCAATACGC TTTCCCTGCG 
CAGATACCTG ACACGCTGTC GCCCGAAGAG CGCTACGCCG TGGACACCCT CGCGCATTAC 
CTCGGTGATC TCGGCGGATC CAACCACCTT CAGGGCACGA AGCCGGAGAC CGTCGGCATC 
GCTCTCGCGG ACTCCCCGGC CGGGCAAGCC GCCTGGATCT ACGAAAAATT CCAATCCAAG 
ACGGACAATC AGGGACTCGC CGAACAGGCT ATCGGCATCG ACGACATGCT CGATGCGATA 
TCTCTGTACT GGTTCACCAA CAGCGCCGCG TCGTCCGCCC GCATCTACTG GGAGAACAAG 
GCGAGCAGCA TGGCCGGCCC GAAGCTGGCG CTGCCCGTGG CGGTGACGGT CTTCCCCCGC 
GACATCCCGC GCCTTCCGCG AACCTGGATC GAAGACACCT ACACGAACCT GATCCACTAC 
GGCGAGGCTG CCCAGGGCGG ACACTTCGCA GCATTGGAAC AGCCCGAGAT TTTGATCGGC 
GAAATCCGCG CCGGCCTCAG GAGCCTCCGT TCCTGA

Protein sequence

MTASTSASSD SPSDLVRPFT VAISDAEIED LKQRLARTRW PNPETVPDWS QGVRLENARS 
LVDYWEREYD WRRFEAELNS FPHFLTTIDG LDIHFIHVKS KNPNAMPLIL THGWPGSIVE 
FLKLIGPLTD PVSFGGTIED SFDVVIPSLP GFGFSQKPTD TGWTVSRIAG AWAELMKRLG 
YTSWAAQGGD WGAVVTTALG AMQPEGLLGI HLNTQYAFPA QIPDTLSPEE RYAVDTLAHY 
LGDLGGSNHL QGTKPETVGI ALADSPAGQA AWIYEKFQSK TDNQGLAEQA IGIDDMLDAI 
SLYWFTNSAA SSARIYWENK ASSMAGPKLA LPVAVTVFPR DIPRLPRTWI EDTYTNLIHY 
GEAAQGGHFA ALEQPEILIG EIRAGLRSLR S