Gene Strop_4333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4333
Symbol
ID	5060818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4908287
End bp	4909267
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	75%
IMG OID	640476595
Product	ROK family protein
Protein accession	YP_001161139
Protein GI	145596842
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.380756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0512746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCCGC CAGCAGGCCA CTGCGTTCTC GCCGTCGATG TCGGCGGGAC AACCATCAAG 
GCGGCCGTCG TCGGCGAGGG CGGCCGCTTC CTGAGTTCAC TGACCGTGCC GTCACAGGCG 
GATGACGACC CGGTCATGGC GATCCGGTCC CTGTGCCGCC AACTGCGCGA GCACGCGCTC 
TCCCTCGGCA GCACACCCGT CGCGATCGGC GTGGTGACGC CGGGCCTCGT GGACGAGCGG 
GACGGAGTGG TGCGGTACGC CGCCAACCTC CGCCTCCGTG ACGTGCCACT GCGCGCCCTC 
ATCAGCGGCG ACCTCGGACT GCCCGTGGCG ATCGGGCACG ACGCGCGGGC AGCCGGCGTC 
GCGGAGGCCA CCGCGGGCGC GGCCGTCGGG TTGGACAACT TCCTGCTGCT GCCTCTGGGC 
ACCGGTATCG CCGCGGCGGT GGTGGTGGAT GGCGTCCCGC TGGCCGGCGC GACCCGCGCG 
GCCGGCGAGG TCGGCCACAT GCCGGTCTAC CCGGGCGGGG AGCAGTGCAG TTGCGGGCAG 
CGGGGATGCC TGGAGGTGTA CGCCTCGGCC GGTGGGATGG CCCGCCGCTA TGCCCGGCGC 
GTCGGCGGGT CGGAGTGGGA CAGCCAAGCC ATCGCCGACG CGGTGGGCAC CGATCCGGAC 
GCCCGCGTCG TCTGGGACGA CGCGACCCGG GCGTTGGGGA CCGCCCTGGC CACCCTCACC 
CTGGCCCTCG ACCCGGCCCG CGTCGTGTTG GGAGGTGGGC TCGCCGAGGC GGGCGCGCTC 
TTCCTCGACC CGGTGCGCGA GGCGATGCGC GACGCCCTCG CCTGGCGGCC TCCACCCCCG 
GTGCTGCGCT CCGCCTTCGG CGCCCAGGCA GCACAGGTCG GCGCCGCCAT CATGGCGCGG 
CGGAAGGCCG GGCTGTCGGT TCCCGACGGC TGGGGCGCAC CCGATCTCGT ACCGTCTGTC 
GCAGGAGAAC TGTCTCACTA G

Protein sequence

MTPPAGHCVL AVDVGGTTIK AAVVGEGGRF LSSLTVPSQA DDDPVMAIRS LCRQLREHAL 
SLGSTPVAIG VVTPGLVDER DGVVRYAANL RLRDVPLRAL ISGDLGLPVA IGHDARAAGV 
AEATAGAAVG LDNFLLLPLG TGIAAAVVVD GVPLAGATRA AGEVGHMPVY PGGEQCSCGQ 
RGCLEVYASA GGMARRYARR VGGSEWDSQA IADAVGTDPD ARVVWDDATR ALGTALATLT 
LALDPARVVL GGGLAEAGAL FLDPVREAMR DALAWRPPPP VLRSAFGAQA AQVGAAIMAR 
RKAGLSVPDG WGAPDLVPSV AGELSH