Gene Caci_2226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2226
Symbol
ID	8333575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	2526552
End bp	2527712
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	70%
IMG OID	644955380
Product	acyl-CoA dehydrogenase domain protein
Protein accession	YP_003112986
Protein GI	256391422
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.190658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0000495631
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTTCG TGGAGCCCGA GGAGCGCCTG GCGCTCCGCC AGGCGGTGCG CGACCTGGCC 
AAGCGGTACG GACCGGACTA CGTGCGCAAG CAGGCCAAGG CCGGCCTGAA GTCGACCGAG 
CTGTGGGCCG AGGTGGGCCG GGCCGGCTAC CTGGGCGTGA GCCTGCCGGT GGAGTACGGC 
GGCGGGGGCG GCGGCATCGC CGACCTGGCG GCGGTCGGCG AGGAACTTGC CCGGGCCGGC 
TGCCCGCTGC TGCTGATCGT GGTCTCCCCC GCCATCTGCG GCACCATCAT CGGCCGCTTC 
GGCACCGAGG AACAGAAGCA GAAGTGGCTC CCGGGCATCT CCGACGGCTC CTTCAAGATG 
GCCTTCGGCA TCACCGAGCC CGACGCCGGC TCCAACTCCC ACAAGATCAC CAGCACGGTG 
CGCCGCGATG GCGACGAGTG GGTTCTTTCC GGTCAGAAGG TCTTCATCTC CGGCGTCGAC 
GAGTCGGACG CGGTCCTGGT GGTGTCCCGC ACTAAGGACG CGGCCACCGG CGACCTGAAG 
CCGGCGCTCA TGGTGGTCCC CACTGACGCG CCGGGCTTCA CCAAGACCAT GATCGAGATG 
GAGATCGCCG GCCCGGAGAA GCAGTTCCAG CTCTTCTTCG ACGACGTCCG TCTCCCGGCC 
GACGCGCTGA TCGGGGACGA GGACGCCGGG CTGCTCCAGC TGTTCGCGGG CCTGAACCCC 
GAGCGCATCA TGGCCGCCGC CTTCGCCATC GGCACCGCGA AGTACGCCCT GGACAAGGCC 
GCCGAGTACG CCAAGACCCG GACGGTCTGG CGCGACCGCC CCATCGGCAC CCACCAGGGC 
GTCGCGCATC CCCTCGCCCA GGCCGCGATC CACGTCGAGC TGGCCAAGGT GATGACGCAG 
AAGGCTGCCT GGCTCTACGA CAACGGCGAC GACTTCGGCG CCGGCGAAGC CGCGAACATG 
GCCAAGTTCG CCGCCGCCGA CGCCGCGGTG GAGGCCGTCG ACCAGGCGAT CCAGACACAC 
GGCGGCAACG GCCTGGCGAC CGAGTACGGC TTGGCGCCGC TGCTCGCGGC GACCCGCGTG 
ACGCGGATCG CGCCGGTCAG CCGGGAGATG ATCCTGAACT TCGTCGCGCA GCACACGCTG 
GGGCTTCCGA AGTCGTACTA G

Protein sequence

MSFVEPEERL ALRQAVRDLA KRYGPDYVRK QAKAGLKSTE LWAEVGRAGY LGVSLPVEYG 
GGGGGIADLA AVGEELARAG CPLLLIVVSP AICGTIIGRF GTEEQKQKWL PGISDGSFKM 
AFGITEPDAG SNSHKITSTV RRDGDEWVLS GQKVFISGVD ESDAVLVVSR TKDAATGDLK 
PALMVVPTDA PGFTKTMIEM EIAGPEKQFQ LFFDDVRLPA DALIGDEDAG LLQLFAGLNP 
ERIMAAAFAI GTAKYALDKA AEYAKTRTVW RDRPIGTHQG VAHPLAQAAI HVELAKVMTQ 
KAAWLYDNGD DFGAGEAANM AKFAAADAAV EAVDQAIQTH GGNGLATEYG LAPLLAATRV 
TRIAPVSREM ILNFVAQHTL GLPKSY