Gene Caci_8813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8813
Symbol
ID	8340206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	10217265
End bp	10219070
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	68%
IMG OID	644961903
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_003119467
Protein GI	256397903
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0249011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTG TCAATGATGT GTCCGCATCG TCTGAATCCA CCGAATCATC CGATTCCGCT 
GGTACCTCTG ATTCCTCTGG TTCCTCAGCT TCGAGCAAGA CCTACCTGCC CTCCGCCGTG 
CGCCCCGAGC TGCGCGTGCC GATGCGCCAG ATCGCGCTGA CCAACGGCGA CTCGGTCGTC 
CTGTACGACA CCTCCGGTCC CTACACCGAC CCCGAGGTGC GCACCGACGT CCGCTTCGGC 
CTGCCGGCGC TGCGCGCTCC GTGGATCGCC GAGCGCGGCG ACACCGCGGA GTACGACGGC 
CGGACCTGGC AGCCGACCGA CGACGGGCTG AAGTCGGCCG ACCTGCGCAA CCTCGACGCC 
GTGTTCTCCG GTGGACGCAA GCCGGTGCGC GGGACGGAGG AGCGGGGCGC GGTCACGCAG 
CTCGCCTATG CCCGGCGCGG CCTCGTCACC GCCGAGATGG AGTACATCGC GGTGCGGGAG 
GGGGTCACCG CGGAGTTCGT GCGGGACGAG GTCGCGCGGG GGCGGGCGGT CATCCCGGCC 
AACGTCAACC ACCCCGAGGC CGAGCCGATG ATCATCGGCC GCCACTTCCT GACCAAGGTG 
AACGCCAACA TCGGCAACTC CTCGGTCGCC TCCTCGATCG AGGAGGAGGT GGACAAGATG 
GTGTGGGCCA CGCGCTGGGG CGCCGCCACC GTGATGGACC TGTCCACCGG CCGGAACATT 
CACACCACCC GCGAATGGAT CCTGCGCAAC AGCCCGGTCC CGATCGGCAC CGTGCCGATC 
TACCAGGCGC TGGAGAAGGT CAACGGCAAG GCCGAGGACC TCACCTGGGA GGTGTTTCGC 
GACACCGTGA TCGAGCAGTG CGAGCAGGGC GTGGACTACA TGACGATCCA CGCCGGCGTG 
CTGCTGCGCT ACGTCCCGCT GACCGCCAAC CGCAAGACCG GCATCGTCTC GCGCGGCGGC 
TCGATCATGG CCGCCTGGTG CCTGGCGCAC CACGAGGAGA ACTTCCTCTA CACGAACTTC 
AGGGAACTGA CGCAGATCCT GGCGCGCTAC GACGTCACCT ACTCCCTCGG CGACGGCCTG 
CGCCCCGGCT CCATCTATGA CGCCAACGAC GCGGCCCAGT TCGCCGAACT GACCACCCTC 
GGCGAACTGT CGAAGATCGC CCGCGAGCTC GGCGTCCAGG TGATGATCGA GGGCCCGGGC 
CACGTCCCGA TGCACAAGAT CAAGGAGAAC GTCGAGCTCC AGATGGAGCT CTGCGACGAG 
GCGCCCTTCT ATACCCTCGG CCCGCTCACC ACCGACATCG CCCCCGGCTA CGACCACATC 
ACCTCCGCCA TCGGCGCGGC GATGATCGGC TGGTACGGCA CCGCGATGCT CTGCTACGTG 
ACGCCCAAGG AACACCTGGG CCTGCCCAAC CGCGACGACG TCAAGCAAGG CCTGATCGCC 
TACAAGATCG CCGCCCACGC CTCCGACCTC GCCAAGGGCC ACGAAGGCGC CCAGCGCTGG 
GACGACGCAC TGTCCGACGC CCGTTTCGAA TTCCGCTGGG AAGACCAGTT CAACCTGGCC 
CTGGACCCCG ACACCGCCCG CGCCTACCAC GACGAGACCC TGCCGGCCGC CCCCGCGAAG 
ACCGCGCACT TCTGCTCCAT GTGCGGCCCG CACTTCTGCT CCATGCAGAT CAGCCGCAAC 
ATCGCGGAGC AATACGGCGA CCAGATGGCC GCCACCGACG ACGGCGAGAT CAAGGCCGGC 
ATGGACGCGA AGTCCGCAGA GTTCCTCGCC TCCGGCGCGC AGGTCTACCT GCCTCTCGCG 
GACTGA

Protein sequence

MTAVNDVSAS SESTESSDSA GTSDSSGSSA SSKTYLPSAV RPELRVPMRQ IALTNGDSVV 
LYDTSGPYTD PEVRTDVRFG LPALRAPWIA ERGDTAEYDG RTWQPTDDGL KSADLRNLDA 
VFSGGRKPVR GTEERGAVTQ LAYARRGLVT AEMEYIAVRE GVTAEFVRDE VARGRAVIPA 
NVNHPEAEPM IIGRHFLTKV NANIGNSSVA SSIEEEVDKM VWATRWGAAT VMDLSTGRNI 
HTTREWILRN SPVPIGTVPI YQALEKVNGK AEDLTWEVFR DTVIEQCEQG VDYMTIHAGV 
LLRYVPLTAN RKTGIVSRGG SIMAAWCLAH HEENFLYTNF RELTQILARY DVTYSLGDGL 
RPGSIYDAND AAQFAELTTL GELSKIAREL GVQVMIEGPG HVPMHKIKEN VELQMELCDE 
APFYTLGPLT TDIAPGYDHI TSAIGAAMIG WYGTAMLCYV TPKEHLGLPN RDDVKQGLIA 
YKIAAHASDL AKGHEGAQRW DDALSDARFE FRWEDQFNLA LDPDTARAYH DETLPAAPAK 
TAHFCSMCGP HFCSMQISRN IAEQYGDQMA ATDDGEIKAG MDAKSAEFLA SGAQVYLPLA 
D