Gene Caci_5157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5157
Symbol
ID	8336511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5923086
End bp	5924051
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	72%
IMG OID	644958255
Product	5-dehydro-4-deoxyglucarate dehydratase
Protein accession	YP_003115857
Protein GI	256394293
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0414541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0087046
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTACCC TGACAGACCG CCTCGACGGC CTGCTCTTCT TCCCTGTCAC GCCGTTCACC 
CCGGACCAGG GGCACGTCGA CCTCGACGCC TTCGCGGCGC ATCTGGAGAG CCGGCTGGCG 
CTGCTGGATC CGGCGCGTCC TGGGCTGTCG GCGGTGTTCG CGGCGTGCGG GACCGGCGAG 
TTCTTCTCGC TGGACCAGCG CGAGTACGCC GAGGTGCTGC GGGTCGCGGT GCAGGTCACG 
GCGGGGCGGG CGCCGGTGCT CGGCGGTGTC GGCTACGGGG CGCCGCTGGC CGCGTCGTTC 
GTGCGGGCCG CTGAGCAGGC CGGGGTCGAC GGGCTGCTGG TCCTGCCGCC CTACCTGGTC 
TCCGGCAGCC AGCAGGGGCT CGCCGACCAC TATCGGAGCA TCGCCGCCTC CACCGAGCTG 
GACCTGATCA TCTACCAGCG CGACAACGTC ACCTTCGCCC CGGAGACCGT CGCGGACCTG 
GCCGAGGTGC CGAACATCAT CGGGTTCAAG GACGGCCGGG GCGACCTGGA CCTGATGCAG 
CGCATCGTCG CGGCGGTCCG CATGCGGCAC GGCGCCGACC GCCTGTTGTT CCTCAACGGC 
CTGCCCACCG CCGAGATGAC GCAGCTCGCC TACCGCGGGA TCGGCGTCCC GCTGTACTCC 
TCGGCGGTGT TCTGCTTCGC CCCGGACATC GCGCTGGCGT TCTACCACGC CTGCCGCGAG 
GGCGACGGGG CGCTCGCCGA CGCGCTGATC GACCGCTTCT ACAAGCCGCT GGTCGAGCTG 
CGCAACAAGG GCGCCGGCTA CGCGGTCTCG CTGGTGAAGG CCGGTGTGCG CCTGGACGGG 
CTGGACGCCG GACCGGTGCG CTCACCGCTG ACCGAGCCGG CTCCGGAGCA CCTGGAGCAG 
CTCGAGCAGC TGATCGCCGA CGGCCGCGCG GTCCTGGCCG AGCACAAGGT CGGAGCCGCG 
GCGTGA

Protein sequence

MSTLTDRLDG LLFFPVTPFT PDQGHVDLDA FAAHLESRLA LLDPARPGLS AVFAACGTGE 
FFSLDQREYA EVLRVAVQVT AGRAPVLGGV GYGAPLAASF VRAAEQAGVD GLLVLPPYLV 
SGSQQGLADH YRSIAASTEL DLIIYQRDNV TFAPETVADL AEVPNIIGFK DGRGDLDLMQ 
RIVAAVRMRH GADRLLFLNG LPTAEMTQLA YRGIGVPLYS SAVFCFAPDI ALAFYHACRE 
GDGALADALI DRFYKPLVEL RNKGAGYAVS LVKAGVRLDG LDAGPVRSPL TEPAPEHLEQ 
LEQLIADGRA VLAEHKVGAA A