Gene Caci_6688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6688
Symbol
ID	8338052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	7707532
End bp	7708752
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	76%
IMG OID	644959782
Product	ROK family protein
Protein accession	YP_003117375
Protein GI	256395811
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.395851
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGAC TGTGGCATTG TCAAGACATG CCCGCGCCCA CCAGCCCCGC CGGCCCGGCC 
AGAGCGACCG GCTCCGCCGA CCGCGCCGTC CCCAACCCCG CCCGGCAGGG GAGCATCCGC 
AACGCCAACC TGGCGCTGCT CTACGGCCTG ATCCTGGACG CCCCGGCGCC GCTGTCCCGC 
GCCGCGCTGG CCGCCACCAC CGGTGTGACC CGCGCCACAG CCTCCGCGCT GGCCGACACG 
CTGCTGGAGG CGGGACTGGT CGCGGAAGTC TCACCGCCGC CGGCCACCGG CGCGGGCCGT 
CCGGCCGCCG GCCTGGTCCC GGCCGCCGAG GGCCCGGCCG GGCTCGGGCT GGAGATCAAC 
GTGGACTACC TGGCGGCCTG CGTGGTGGAC CTGACCGGCG CCGTCCGCGC CACCGTCATA 
TCCGCGGGCG ACCAGCGCGA CCGCTCGGTG TCGGAGGTGC TGGCCGATCT GGCCGGGCTG 
GCGCGCCAGG CCGTCTCGGA GGCCGGGCTG ACCGTCGCCG GCGCCGCGGT CGCCGTCCCG 
GGTCTGGTCG AGGCGCCGCA CGGACGGATC CGGAGCGCGC CGAACCTGGT GTGGCAGGAC 
GTGGAGATCG GCGCGGCGCT GCGCAGCGCG CTGCCGGAGA CGCCGTTCGA GCCGGTCGTC 
GGGAACGAGG CGGATTTCGC AGCCCTGGCC GAGGCGCACG GGGTTTTCGA CGGGGACGCG 
GACGGCCCGG CGGCGCCGCT GACCGACTTC CTGTACGTCT CGGGCGAGAT AGGCGTCGGC 
GCGGGCGTCA TCCTGGACCG CGAGCTGTTC CGCGGCGCGC GGGGGTGGGC CGGCGAGATC 
GGGCACGTCA CGGTCCAGCC CGAGGGGGTC CAGTGCCGCT GCGGCGCGCG GGGCTGTCTG 
GAGACTGTCG CAGGACTCGA AGCGCTGCGC CGCGACGGAC CCGAAGCCGC TGCTTCGGCA 
CTCGGCCGGG CGGCAGCGGC CGCGGTGAAC CTGCTGGATC TGCCGGCGGT CGTCCTCGGC 
GGCGCCTATG CCCGGCCGGA GTTCGCCGCG CTGGTTCCGG GGGTGGAGAA GGCACTGGCC 
GACCATGTGA TCTCGGCGCG ATGGGCTCCG GTCGCCGTGC ACGTGTCGCG GCGCGGAACC 
GCGGCGGCGG TGACCGGCGC GGCGACGGCG GTCATCCGGC GGGTGCACGC CGATCCGGCG 
GCTTGGATGG CGGCACGCTG A

Protein sequence

MDGLWHCQDM PAPTSPAGPA RATGSADRAV PNPARQGSIR NANLALLYGL ILDAPAPLSR 
AALAATTGVT RATASALADT LLEAGLVAEV SPPPATGAGR PAAGLVPAAE GPAGLGLEIN 
VDYLAACVVD LTGAVRATVI SAGDQRDRSV SEVLADLAGL ARQAVSEAGL TVAGAAVAVP 
GLVEAPHGRI RSAPNLVWQD VEIGAALRSA LPETPFEPVV GNEADFAALA EAHGVFDGDA 
DGPAAPLTDF LYVSGEIGVG AGVILDRELF RGARGWAGEI GHVTVQPEGV QCRCGARGCL 
ETVAGLEALR RDGPEAAASA LGRAAAAAVN LLDLPAVVLG GAYARPEFAA LVPGVEKALA 
DHVISARWAP VAVHVSRRGT AAAVTGAATA VIRRVHADPA AWMAAR