Gene Dshi_1274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1274
Symbol
ID	5711832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1324124
End bp	1325101
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	64%
IMG OID	641267186
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001532617
Protein GI	159043823
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.031802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.351389
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGG ACATAGTCTG GGAGGACGAC ATGAAAACCA TCCTGAAATC GGTGGCGCTT 
GGTGCCGCAC TGGTCGCGGC ACCTTTCGCA TCCTTCGCGC AGAGTGACGA TGATCTGAAT 
TACGTGCTGG TCAGCCATGC ACCCGACAGT GACACCTGGT GGAACACCAT CAAGAACGGC 
ATCGCGCTGG CGGGCGAGCA GATGGGCGTG TCGGTCGAAT ACCGCAACCC GCCCACCGGT 
GACATTGCCG ACATGGCGCG AATCATCGAG CAGGCCGCGG CCTCCGCGCC CGATGGCATC 
ATCACCACGC TGGCGGATTT CGACGTGCTG CAAGGGCCGA TCAAGAACGC GGTCGATCAG 
GGCATCGATG TCATCATCAT GAATACCGGC ACACCCGAAC AGGCCCGCGA GATCGGCGCC 
CTGATGTATG TCGGCCAGCC CGAGTACGAC GCGGGCTTCG CCGCCGGGCA GCGCGCCAAG 
GGCGAGGGGG TCACCAAGTT TCTTTGCGTG AACCACGCGA TCCAGCAGCC CACCGTGGGC 
GAGCGCTGCC GCGGCTATGC CGACGGGCTC GGGATCGAGC TGGGCGATGC GATGATGGAC 
AGCGGCACCG ACCCCGCCGA GATCAAGAAC AAGGTCATGG CCTACCTGTC CACGAATGAA 
GACGTCGATG GCATCCTGAC CCTCGGCCCG GTCTCGGCGG ACCCGACCAT CGCGGCGCTG 
AACGAGATGG GCCTGGCGGG CGAAATCCAT TTCGGCACCT TCGATCTGGG CGAGGAAATC 
GTGAAGGCGA TCAAGGACGG CACCATCAAC TGGGGCATCG ACCAGCAGCC CTTCCTGCAG 
GCCTACATGC CGGTGGTGAT CCTGGCCAAC TGGGACCGCT ACGGGGTTTT GCCGGGCAAC 
AACATCAACT CCGGCCCAGG CTTCGTGACC GCCTCCGGTC TGGAGAAGGT CGAGGCCTTC 
GCGGGCGAGT ACCGCTAA

Protein sequence

MRADIVWEDD MKTILKSVAL GAALVAAPFA SFAQSDDDLN YVLVSHAPDS DTWWNTIKNG 
IALAGEQMGV SVEYRNPPTG DIADMARIIE QAAASAPDGI ITTLADFDVL QGPIKNAVDQ 
GIDVIIMNTG TPEQAREIGA LMYVGQPEYD AGFAAGQRAK GEGVTKFLCV NHAIQQPTVG 
ERCRGYADGL GIELGDAMMD SGTDPAEIKN KVMAYLSTNE DVDGILTLGP VSADPTIAAL 
NEMGLAGEIH FGTFDLGEEI VKAIKDGTIN WGIDQQPFLQ AYMPVVILAN WDRYGVLPGN 
NINSGPGFVT ASGLEKVEAF AGEYR