Gene Caci_5104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5104
Symbol
ID	8336458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5861426
End bp	5862640
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID	644958203
Product	ROK family protein
Protein accession	YP_003115805
Protein GI	256394241
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.288839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.92903
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCAGG CCGGTGCGCA GACGACGCGC GATCTTCGCC GTCGTAGCCG CGCCACCTTG 
CTGTCGTGTA TCTACCTCGG GCGGGCGGTG AGCCGTCCGG AATTGGCGCG GTTGGCCGGG 
ATGAGCTCGG CGGCGGTGAG CAATGTCGTG TCGGATCTGA TCTCCGACGG GCTGGTGGCC 
GAGGCCGGGT CGGTGGACTC CAACGGTGGG CGGCCGCGCA CGATGCTCGC GGCGCGGCCC 
GGGTTCGGCT ACGCGGTCGG CGTCGACATC GGCGAGACTC ACATCCACGT GGTGCTGTTC 
GACTGGACGC TGTCCACCCT GGCGACCTCC ACGCACGAGA TCCGCGTCGG ACGCCTGGAT 
CCGGATGTCG TGGTGCGCCT GGTCGTCTCC GGCGTGCGCT CCCTGCTGGA CAGCACCGGC 
GTTCCGCACG AGCGGCTGCT CGGTATCGGT ATCGGCGTCC CCGGCGCGGT GCAGGAGGGC 
GAGCGCGGCG TGGTCCACGC ACCGACGCTC GGCTGGTCCG GCGTACCGCT CGGCGACGCA 
CTGCGAGCAG AGCTCGACGC GCCGATCCTC ATCGACAACT GCGCACGCAC CCTCGGCCAG 
GCTGAGGCAT GGCGCGGCGC GGGACGCGAT GCACGCCGCG CGGTCGTCGC CCTGTGGGGC 
GTGGGCGTCG GCGCCGCGAT CGCCGAAGGC TCCTCCCTTG CCGAAAGCGG CTCCAGCTCC 
ACCAGCGAGT GGGGCCACGC GGTGATCGAA GCCCGCGGCC GCGCCTGCCG CTGCGGCTCC 
CACGGCTGCC TCGAGGCCTA CGTCGGCGCC ACGGCGATCC TCGACGCGTA CCTGGCCCAC 
CCCGCCGGCA AGCCCTTCAC CAGCGACGGC ACCGAAGCCA AAATGGCCGA ACTCGCCGCC 
CGAGCCACCA CCGGCGCCGA CGAAGCCGCC ACCGCCACCT TCGACGAAGC AGCCGAGTAC 
CTGGGCATCG GCGTCGGCAA CCTGATCAAC ATGATCAACC CCGACCAGGT CATCCTCGCC 
GGCTGGGTAG GCGAACAACT GGGCCCCCTC CTCATGCCCG CCATCCGCGA AGCCGCCCGC 
CGCCACGCCC TCCCCTACCT CTTCGACCAA ACCCGCATCG ACGTCGGCGA ACTGGGCCCG 
GGCGCGGTAG CCCTCGGCGC CGCAACCCTG CCGGTGGCGC GACTGCTGGC AGCAGGCGGA 
CACTTCGCAA GCTGA

Protein sequence

MIQAGAQTTR DLRRRSRATL LSCIYLGRAV SRPELARLAG MSSAAVSNVV SDLISDGLVA 
EAGSVDSNGG RPRTMLAARP GFGYAVGVDI GETHIHVVLF DWTLSTLATS THEIRVGRLD 
PDVVVRLVVS GVRSLLDSTG VPHERLLGIG IGVPGAVQEG ERGVVHAPTL GWSGVPLGDA 
LRAELDAPIL IDNCARTLGQ AEAWRGAGRD ARRAVVALWG VGVGAAIAEG SSLAESGSSS 
TSEWGHAVIE ARGRACRCGS HGCLEAYVGA TAILDAYLAH PAGKPFTSDG TEAKMAELAA 
RATTGADEAA TATFDEAAEY LGIGVGNLIN MINPDQVILA GWVGEQLGPL LMPAIREAAR 
RHALPYLFDQ TRIDVGELGP GAVALGAATL PVARLLAAGG HFAS