Gene Caci_7220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_7220
Symbol
ID	8338588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	8389480
End bp	8390688
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	72%
IMG OID	644960301
Product	ROK family protein
Protein accession	YP_003117890
Protein GI	256396326
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.501197
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTCCC GCGCCCAGAA AACGACTCGT GACCTGCGGT GGCACAACCG CGCCGATCTG 
CTGACACGGC TGTACCTGGG CGAGGCAACA AATCGCAACG ATCTGGCCCG GGCGTCCGGA 
CTCAGCGCGG CGACGATCAG CAACGTCGTC TCGGATCTGA TCGGCGACGG ACTCGTCGGC 
GAGAACGGCT CGCAGAGCTC GGCCGGCGGC CGTCCGCGCT CGCTGCTGCG CGTCCTGCCA 
GCGTTCGGTC ACGTCGTCGG CATCGACATC GGCGAGACCG AGATCCGGGT CGGGCTCTTC 
GACTGGACCC TGCATCCGGT CGCCGAAGAG GCGCGGCCCG TGGACATCCC GCGCGTCCCG 
CCGCAGCAGG TCGCCGACCA GGTTCTGTCC GAGATAGCAG CGGTCACCGC ACGCGCCGGG 
ATCGCTGTGG ACGACCTGCT CGGCGTCGGC ATCGGCGTGC CCGGCGCCGG CGGATCGGTG 
ATCCACGCGC CCACGCTCGG TTGGTCCGCG GTCCCGCTCG CCGGTCTGCT CCGCGACCGC 
CTCGGCTTCA CCCCCGACAT CGACAACGGC GCCATGGCGC TCGGTCAAGC CGAAGCCTGG 
CGCGGAGCCG CACGAGGCGC CGAACGTGCG GTGGCCCTCC TGCTCGGTAC CGGCGCCGGC 
GGAGCGCTCT CGCTCGCCGC CGGTCCCGGC GGCCGAGCGC GCAGCTTCAC CATGGAGTGG 
GGACACACGG TCGTCGACCT CGAAGGTCCC CACTGCCGCT GCGGAGCACG CGGCTGCCTG 
GAGACCTACA TCGGCGCCGA GGCGATCCTC GCGCGCTACG CCGCGACGCC GGGCAGCACT 
CCGCTGGCCG AAGACGGCGT CGAAGCCCAG CTGTCCGAAC TCGTCGCCCG CGCCTCCCAG 
CACCACGAAT CCGCGGCGCT CGAGGTTCTG GACGCCACGG CGACCTACCT CGGCGTGGGA 
ATCAGCAACC TGATTAACCT CGTCGCCCCG GACCGGGTGA TCATCTCCGG CTGGGCCGGC 
GCGTTGCTCT GCGACGCGGC CCTGCTTCCC GCCGTCCGGC GCGTCGTGCG CCGGCACGCC 
CTGCCCTACC TGCAGGAATT CACGCGCATC GAGCCGGGCG AACTCGGTCC CTCGGCGACG 
GCACTCGGAG CGGCGACGCT TCCGGTCGCG CGGCTGCTGG CCGACGGCGG CCGACGCGAG 
GAGCGCTGA

Protein sequence

MTSRAQKTTR DLRWHNRADL LTRLYLGEAT NRNDLARASG LSAATISNVV SDLIGDGLVG 
ENGSQSSAGG RPRSLLRVLP AFGHVVGIDI GETEIRVGLF DWTLHPVAEE ARPVDIPRVP 
PQQVADQVLS EIAAVTARAG IAVDDLLGVG IGVPGAGGSV IHAPTLGWSA VPLAGLLRDR 
LGFTPDIDNG AMALGQAEAW RGAARGAERA VALLLGTGAG GALSLAAGPG GRARSFTMEW 
GHTVVDLEGP HCRCGARGCL ETYIGAEAIL ARYAATPGST PLAEDGVEAQ LSELVARASQ 
HHESAALEVL DATATYLGVG ISNLINLVAP DRVIISGWAG ALLCDAALLP AVRRVVRRHA 
LPYLQEFTRI EPGELGPSAT ALGAATLPVA RLLADGGRRE ER