Gene Caci_8066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8066
Symbol
ID	8339444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	9360567
End bp	9361727
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	66%
IMG OID	644961151
Product	Radical SAM domain protein
Protein accession	YP_003118730
Protein GI	256397166
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.437454
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTCCG GGCTCAAGCG GGATCTCGAG GACAAGGTCC TCTCCGGCTC GCGGCTTTCC 
TTCGAGGACG GCGTGGCGCT GTACGACACC GATGAGGTGG CCTGGCTCGG CGAACTCGCC 
CACGAGATGC GGACCCGCAA AAACGGCGAC AAGGTCTTCT TCAACGTCAA CCGCCACCTG 
AACATGACGA ACGTCTGTTC GGCGTCGTGC GCGTACTGCT CCTTCCAGCG CAAGCCGGGG 
GAGAAGGACG CCTACACGAT GCGCATTGAG GAAGCGGTCC GCCTGGCCAA GGACATGGAG 
CCGGACGGCA TCACCGAGCT GCACATCGTC AACGGCCTGC ACCCGACGCT GCCGTGGCGC 
TACTACCCGA AGTCGATCAG CGAGCTCAAG GCGGTGCTGC CCGGCGTCTC GATCAAGGCC 
TTCACCGCCA CCGAGATCCA CTGGTTCGAG AAGATCTCCG GCCTGAGCGC GGAGGAGATC 
CTCGACGAGC TGATCGAGGC CGGTCTGGAG TCCCTGACCG GCGGCGGCGC CGAGATCTTC 
GACTGGGAGA TCCGCTCGCA GATCGTGGAC CACGCCACCC ACTGGGAGGA CTGGTCCCGC 
ATCCACCGCC TCGCGCATGC CAAGGGCCTG CGCACCCCGG CCACCATGCT CTACGGCCAC 
ATCGAGGAGC CCCGGCACCG CGTGGACCAC GTGCTCCGGC TGCGCGAGCT CCAGGACGAG 
ACCGGCGGCT TCGCCGTCTT CATCCCCCTG CGCTTCCAGC ACGACTTCCA CGACAGCAAG 
GACGGCAAGG TCCGCAACCG CCTCATGAAC CAGCCGATGG CCACCGGCGT CGAGGCACTG 
AAGACCTTCG CCGTCTCCCG CCTGATGCTC GACAACTTCG ACCACGTGAA GTGCTTCTGG 
GTCATGCACG GCCTGTCCAC CGCCCAGCTC GCGCTCAACT ACGGCGCCGA CGACCTGGAC 
GGCTCGGTGG TCGAGTACAA GATCACCCAC GACGCCGACG ACTACGGCAC CCCGAACAAG 
ATGACCCGCG AAGACCTCCT CGAGCTGATC CGCGACGCCG GCTTCACCCC GGTCGAGCGC 
AACACCCGCT ACGAGATCAT CCGCGAGTAC GACGGCCCGG AGCCGGCCCG CCGCGAAGAG 
CCGCAGCTGA TGACCTTCTG A

Protein sequence

MDSGLKRDLE DKVLSGSRLS FEDGVALYDT DEVAWLGELA HEMRTRKNGD KVFFNVNRHL 
NMTNVCSASC AYCSFQRKPG EKDAYTMRIE EAVRLAKDME PDGITELHIV NGLHPTLPWR 
YYPKSISELK AVLPGVSIKA FTATEIHWFE KISGLSAEEI LDELIEAGLE SLTGGGAEIF 
DWEIRSQIVD HATHWEDWSR IHRLAHAKGL RTPATMLYGH IEEPRHRVDH VLRLRELQDE 
TGGFAVFIPL RFQHDFHDSK DGKVRNRLMN QPMATGVEAL KTFAVSRLML DNFDHVKCFW 
VMHGLSTAQL ALNYGADDLD GSVVEYKITH DADDYGTPNK MTREDLLELI RDAGFTPVER 
NTRYEIIREY DGPEPARREE PQLMTF