Gene Daci_4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_4053
Symbol
ID	5749640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	4459980
End bp	4461143
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	70%
IMG OID	641299155
Product	periplasmic sugar-binding protein, putative
Protein accession	YP_001565069
Protein GI	160899487
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.299221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.087362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCTG CTGCTCCTTC TTCGGGACGC CCCGGTGGAC TCCACCGGGG CGTCTTGCCG 
TGGGCGCTGC GTATGACCTA CATGGCCTGG GTGATGGGCG TGCTGGCGCA GTCGGCCGCT 
GCCGCCGCGC AAAGCGTGGT CTTCATCAAC CCCGGCCGCT CCGACGAGAG CTACTGGACC 
ACGGTCAGCG AGGCCATGCA GGACGCGGCC AGCAGCCTGG GCATGCAGCT GCAGGTGCGC 
TATGCGCAGC GTGACCACCT GCGCCCCATC GAGATTGCGC GCCAGATTGC CGCCTTGCCC 
AAGGCGCAGC GGCCCCGCTA CGTGATGTTT ACCAACGACT ACAGCGTGGC GCCTGAAATC 
CTGCGCACGC TGGAGGCCGC AGGCATCGAC AGCTTCATGG CCTTCAGCGG CGTGCCCGAG 
ACATTGCGCG GCCAGACCGG CGTGGCGCGG GAGCGCTATC GCCACTGGCT GGGCAGCCTG 
GAGCCGGGCG CGGAGGAGGC CGGCTACCTG ACCGCCAAGT CACTGTTCGC CGCTGCGCGG 
GCATCGGGCC AGGCGCGTGC GGCCGATGGC CGGCTGCACA TGGTGGCCAT TGCCGGGGAC 
CGCTCCACGC CCTCCTCGGT GGAGCGCAAT GCCGGCATGC GCCGCGCGGC GGCCGAGGCC 
AGCGACGTGG TGCTGCAGCA GGAAGTCTTT GGCGAATGGC GCCGCGAACG CGCCGAGCAG 
CAGGCGGCCG TGCTGTTCCA GCGCTATCCC GAGGTGCGCC TGGTCTGGGC GGGCAACGAC 
GAGATGGCCT TTGGCGCCAT GCAGGCCTGG CGGGCGCGGG GCGGCTCGCC GGGGCGTGAC 
GCCTTCTTCA GCGCCATCAA TTCATCGGCC GCCGCCATGA CGGCGCTGCG CACGGGCGAG 
CTGTCGGCAC TGGCGGGCGG CCATTTCCTG ACCGGCGCCT GGGCCCTGGT CATGCTCTAC 
GACCATGCGC ACGGCGCCGA TTTCGCCTCC GAAGGGCTGG AGCAGGTGCG GCCCATGTTC 
ACGCTGCTGG ACAAGTCCCA GATCGACCGC TACGAGCACA GGATCAGCGC GCCGCTGGCC 
CCTCTGGACT TTCGCAGCTA CAGCAAGCAC CTCAATCCCC GGCTGCGGCG CTACGGATTC 
GAGCTCAAGC ACCTGCTGCG CTGA

Protein sequence

MIPAAPSSGR PGGLHRGVLP WALRMTYMAW VMGVLAQSAA AAAQSVVFIN PGRSDESYWT 
TVSEAMQDAA SSLGMQLQVR YAQRDHLRPI EIARQIAALP KAQRPRYVMF TNDYSVAPEI 
LRTLEAAGID SFMAFSGVPE TLRGQTGVAR ERYRHWLGSL EPGAEEAGYL TAKSLFAAAR 
ASGQARAADG RLHMVAIAGD RSTPSSVERN AGMRRAAAEA SDVVLQQEVF GEWRRERAEQ 
QAAVLFQRYP EVRLVWAGND EMAFGAMQAW RARGGSPGRD AFFSAINSSA AAMTALRTGE 
LSALAGGHFL TGAWALVMLY DHAHGADFAS EGLEQVRPMF TLLDKSQIDR YEHRISAPLA 
PLDFRSYSKH LNPRLRRYGF ELKHLLR