Gene Caci_6048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6048
Symbol
ID	8337411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	6970178
End bp	6971542
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	72%
IMG OID	644959152
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_003116746
Protein GI	256395182
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3200] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01358] 3-deoxy-7-phosphoheptulonate synthase, class II

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.066301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAG TCGTCAGGAA TCCGGCCGGG ACCGGATCCA TCGAAGACAC GTGGTCCGCG 
CTCCCCGCGG GCCAGCAGCC GGAGTGGCCG GACGCCGCCG AGCTGTCCTC CGTCGTCTCC 
GAGCTCCGCT CGTATCCGCC CCTGGTCTTC GCCGGGGAGG CCGACCAGCT CAAGGACCGC 
ATCGCCGCGG TGTCCCGGGG CGAGGCCTTC CTGCTCACCG GCGGGGACTG CGCCGAGACC 
TTCGCCGGGG TCACCGCCGA CGCGATCCGC GCCAAGCTCA AGACGCTGCT GCAGATGGCC 
GTCGTGCTCA CCTACGCCGC CTCGCTGCCG GTGGTGAAGG TCGGGCGCAT CGCCGGGCAG 
TACTCCAAGC CGCGCTCCAA GCCGACCGAG ACCCGCGACG GGGTCACCCT TCCGGCGTAC 
CGCGGCGACT CCGTCAACGG CTTCGACTTC ACCCCCGAGG CCCGCACCCC GGACCCCAAG 
CGCCTGCTGC GCCTGTACCA GGCCAGCGCC TCCACGCTGA ACCTGGTGCG CGCGTTCACC 
ACCGGCGGCT ACGCCGACAT GCGCCAGGTG CACGCCTGGA ACCAGGACTT CGTGGCCGGC 
TCGCCCTCCG GGGAGCGCTA CGAGGCGCTG GCCGGGGAGA TCGACCGCGC CCTGCAGTTC 
ATGCGCGCCT GCGGCACCGA GCCGGAGGAA CTGCGCACCG TCGAGTTCTA CGCCGCGCAC 
GAGGGCCTGG TGCTCCCGTA CGAGTCGGCG CTGACCCGCA TCGACTCGCG CACCGGCAAC 
CCCTACGCGA CCAGCGGCCA CTACATCTGG ATCGGCGAGC GCACCCGGGA CCTGGACGGC 
GCGCACGTGG AGTACTTCAG CCGGATCAGC AACCCGATCG GCATCAAGCT GGGCCCGGGC 
ACCGCCCCGG ACGACGCGCT GTCCTACCTG GACCGGCTGG ACCCCGACCG CGAGCCCGGC 
CGGCTGTCGT TCATCGTCCG CATGGGCGCC GGGCAGGTGC GCGAGAAGCT GCCGGCCCTG 
GTGGAGAAGG TGCGCGGCGA GGGCCACCAG GTGGCGTGGA TCTGCGACCC GATGCACGGC 
AACACCTTCG AGGCGCCCTC GGGCCACAAG ACCCGCCGCT TCGACGACGT GCTCGACGAG 
GTCAAGGGCT TCTTCGAGGT GCACCACGGC CTCGGCTCGC ACCCCGGCGG CATCCACGTC 
GAGCTCACCG GCGAGGACGT CACCGAGTGC GTCGGCGGCG GCACGGAGAT CGCCCTGGAC 
GCCCTGCACC AGCGCTACGA GACGCTGTGC GACCCCCGGC TGAACCGCAG CCAGTCGCTG 
GACCTGGCGT TCCTCGTCGC GGAGATGCTG CGCGCCCGGC GCTGA

Protein sequence

MSEVVRNPAG TGSIEDTWSA LPAGQQPEWP DAAELSSVVS ELRSYPPLVF AGEADQLKDR 
IAAVSRGEAF LLTGGDCAET FAGVTADAIR AKLKTLLQMA VVLTYAASLP VVKVGRIAGQ 
YSKPRSKPTE TRDGVTLPAY RGDSVNGFDF TPEARTPDPK RLLRLYQASA STLNLVRAFT 
TGGYADMRQV HAWNQDFVAG SPSGERYEAL AGEIDRALQF MRACGTEPEE LRTVEFYAAH 
EGLVLPYESA LTRIDSRTGN PYATSGHYIW IGERTRDLDG AHVEYFSRIS NPIGIKLGPG 
TAPDDALSYL DRLDPDREPG RLSFIVRMGA GQVREKLPAL VEKVRGEGHQ VAWICDPMHG 
NTFEAPSGHK TRRFDDVLDE VKGFFEVHHG LGSHPGGIHV ELTGEDVTEC VGGGTEIALD 
ALHQRYETLC DPRLNRSQSL DLAFLVAEML RARR