Gene Caci_3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3372
Symbol
ID	8334725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3722951
End bp	3724681
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	70%
IMG OID	644956516
Product	thiamine pyrophosphate protein TPP binding domain protein
Protein accession	YP_003114119
Protein GI	256392555
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCG TCGCCGAACA GATCGTCACC GCCCTGGCCG ACCTGGGGGT CCGCACCGTC 
TGGGGAGTGG TCGGGGACGC GCTCAACCCC GTGACGGACG CGATCCGCCG CGAAGAGCGC 
ATCGAGTGGA TCGGCACCCG GCACGAGGAG GCGGCGGCCT TCGCCGCGAG CGCGCAGGCC 
CAGCTGAGCG GCACCATCGG CGTGTGCATG GGAACCGTCG GACCGGGTTC GCTGCATCTG 
CTGAACGGCC TGTACGACGC CAAGAAGTCG CACGCCCCGG TGCTGGCGAT CTGCGGCCAG 
GTCCCCTCGG CCGAGTTGGG CGCCGAATAC TTCCAGGAGG TCGACAACGA CGCGGTGTTC 
CGCGACGTCG CCGCCTTCCG GCACACGGTG ACCAGCGCGA GCCAGATGCC CCGGGTCCTG 
GAGCAGGCGG TGCAGACGGC CTACGCCACC CCGGGCGTCT CGGTGCTCAC GCTGCCCGGC 
GACATCGGCT CCGCGGAGGT CGCCAAGGAC AGCGCCGTCC ACATCACGCG CGTCCCGGCA 
CGTCTGACAC CCGACGACGA CGAGATCACC CGCGCCGTGC GGCTCCTGGA CGACGCCAAG 
ACCGTGACGA TGCTCGTCGG CGCCGGAGCC CGGGAATCGC GTGCCTCAGT GCTGCAACTG 
GCCGATCGCC TGGCCGCTCC GATGGTCCTG ACTCTCAAGG CGAAGGAAGG GCTCGAAGAC 
GACAACCCCT TCCAGATCGG CCAGAGCGGC CTGATCGGCA ACCCGGCGAC CCGCGAGGCG 
TTCGAGTCCG CCGGCGCGCT GCTGATGATC GGCACGGACT TCCCGTATCC CGACTGGCTG 
CCCCGCTCGA CGCCGACCGT CCAGATCGAC ACGCGCGCCG GCCACATCGG GCGCCGTACG 
CCGGTCGACG TCGGCGTCGT CGGCGACGCG GGGCTGAGCA TCGCCGCGCT CCTGAACCGG 
GTGCGCAGCA AGGACGATCG CAGCCATCTG GAAAAGGCAC GCTCGAGCTA CGAGGACTGG 
CAAGGTCACC AGCGCCGCCT CACCGACCCG GAGTTCGACC AGAGCCTGGT GGGCAAGGTG 
CGGTCTTGGC TCGACAACAC CGAGGACAAG ATCCGCCCCG AGGCGCTGGC CACGCTCATC 
GACACGCACG CCGCCGAGGA CACCGTGTTC ACCACCGACA CCGGCATGTC CACGGTCTGG 
CTCGCGCGCT GCGTGACGAT GCGCGGCAGC CGCCGCCTGA TCGGGTCCTT CAACCTCGGT 
TCGATGGCGA ACGCCCTGCC GCACGCCCTC GGCGCCGCCG CCCTGGACCG GCAGCGGCAG 
GTCGTCGCCT TCTGCGGCGA CGGCGGTCTG ACGATGCTGC TCGGCGACGT GCTCACCGCC 
GTCGCCTACG ACCTGCCGGT CAAGCTCATC GTCTTCGACA ACGGCCGCCT GGGCATGGTC 
AAGCTCGAGC AAGAGCAAGG CGGGCTCCCG GAGTTCGGCA CCGAGTTGGC CAACCCCGAC 
CTGGCCGCCG TCGCCACCGC GATGGGCATG CCGGCCGCCC GGGTCACCGA ACCCGAGGCG 
CTGGAGGCCG CTGTCCAGGC CGCACTCGCC TCACCGGGTC CGTACCTGCT CGACGTGGTC 
ACCAATCCCG AAGAGATCGC GCTGCCGCCG AAGACAAGTA TCGACCAGGC GTGGGGGTTC 
GCGATCGCGA AGATGAAGGA AGGGATTGTG AGCCGGGGCG CCAAGTCCTG A

Protein sequence

MTTVAEQIVT ALADLGVRTV WGVVGDALNP VTDAIRREER IEWIGTRHEE AAAFAASAQA 
QLSGTIGVCM GTVGPGSLHL LNGLYDAKKS HAPVLAICGQ VPSAELGAEY FQEVDNDAVF 
RDVAAFRHTV TSASQMPRVL EQAVQTAYAT PGVSVLTLPG DIGSAEVAKD SAVHITRVPA 
RLTPDDDEIT RAVRLLDDAK TVTMLVGAGA RESRASVLQL ADRLAAPMVL TLKAKEGLED 
DNPFQIGQSG LIGNPATREA FESAGALLMI GTDFPYPDWL PRSTPTVQID TRAGHIGRRT 
PVDVGVVGDA GLSIAALLNR VRSKDDRSHL EKARSSYEDW QGHQRRLTDP EFDQSLVGKV 
RSWLDNTEDK IRPEALATLI DTHAAEDTVF TTDTGMSTVW LARCVTMRGS RRLIGSFNLG 
SMANALPHAL GAAALDRQRQ VVAFCGDGGL TMLLGDVLTA VAYDLPVKLI VFDNGRLGMV 
KLEQEQGGLP EFGTELANPD LAAVATAMGM PAARVTEPEA LEAAVQAALA SPGPYLLDVV 
TNPEEIALPP KTSIDQAWGF AIAKMKEGIV SRGAKS