Gene Daci_4426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_4426
Symbol
ID	5750014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	4846995
End bp	4848665
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	66%
IMG OID	641299528
Product	extracellular solute-binding protein
Protein accession	YP_001565441
Protein GI	160899859
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.169116
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.480332
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAA GACGCTTCCT GCCTCGCCTT TCCCTGCTGC GCACCCACTT GCGCACCCTG 
CGAATTTCCG CACTGCTTCC CGCCCTGGCC GCAGCCCTGC TGTGCGCACC GCCCGCCCAG 
GCCGAAACCC TGCGCTGGGC GCGCTCCACC GACGCATCCA CGCTGGACCC GCATGCGCTG 
AACAACGGCC CCAACCACAA CCTGCTGCAT CAGATCTACG AGCCGCTGAT CATCCGCACG 
GCCGATGGCA AGCTGCTGCC CACCCTGGCC ACGTCCTGGG CGCTGACTGC CGACCCCTCG 
GTCTGGGAGT TCAAGCTGCG CAAGGGCGTG AAGTTCCATG ACGGCAGCCT GTTCACGGCC 
GACGACGTGC TGTTCTCGCT GCGCCGCGCG CGCTCGGCCA CCTCGGACAT GCGCTCGCTG 
CTGACCTCGA TCACCGACGT GACCAAGGTC GATGCCTTCA CCGTGCACAT CAGGACCAAC 
GGACCCAACC CGCTGCTGCC GGCCAGCCTC ATCAACATCC AGATCTTGAG CGCCGCCTGG 
GCCAAGGCCC ATGGTGCCGA GCAGCCGCAG AACGCGCTGG CCAAGGAAGA GAACTACGCC 
ACGCGCAACG CCAACGGCAC GGGGCCCTAC GTCATCGCCT CGCGCGAGCA GGACACGCGC 
ACCGTGCTGC GGCAGTTTCC CGGCTACTGG GGCAAGGGGC TGTTCCCGCT GGAAATCGAC 
GAACTGGTCT ACCTGCCCAT CAAGTCCCAG GCCACGCGCG TGGCGGCGCT GCTGTCGGGC 
GAGGTGGACT TCGTGCAGGA CCTGCCCATC CAGGACATTG CGCGCCTGAG CGCCGACCCG 
CGCTTTCGCA TCAACCAGGC CGCCGAGAAC CGCACCATCT TCCTGGGTCT GAACGTGGGC 
GCCGCCCCGC TGTCGCATTC CGATGTGAAG GACAAGAACC CCCTGGCCGA CCTGCGCGTG 
CGCCAGGCCT TCCAGCTGGC CATCGACCGG CAGGCCATAC AGCGCGCCGT GATGCGCGGC 
CTGTCCGTGC CCACCAACAT CATTGCGCCG CCCTTTGTGC ACGGCTACGA GAAATCCTTT 
GGCGCCGTGG GCAAGGCCGA CCTTGTCCAG GCCAGGAAGC TGCTGGCCGA GGCCGGCTAT 
CCCAACGGCT TCGGCATCAC CCTGCATTGC ACGAACGACC GTTATCTGAA CGACGAGGCC 
ATCTGCCAGG CCATCGCCGG CTTTCTGGGC CGCATCGGCG TGAAGACCGC CGTGTCGTCG 
CGGCCGCTGG CCATCCAGAC GGCGGCCATC AACAACCAGG AGACGGATTT CTACCTCTAC 
GGCTGGGGCG TGCCCACCTA TGACTCGGCC TATGTCTTCG ACTACCTGGT GCACACGCGC 
GGCAAGAACG GCCGGGGCAA CACCAATGCC ACGCGCTACA GCAATGCCGA GCTGGACAGC 
CAGATCGTCT CCCTGGCCTC CGAGGGCGAT GCGCGCAAGC GCGATGCCAC CATCCACTCC 
ATCTGGAGCA CGGTGCAAAA GGAGCTGATC TACCTGCCGC TGCACGACCA GATCCAGACC 
TATGCCATGG TGCGCAAGTT CGACATCCCG GTGAATCCGT CGAACACGCC TTACTTCAAG 
CTGTTCAAGC AGCCCGGTGC GCGCCAGGCT GCGGTGGCCG GCGCGCAGTA G

Protein sequence

MTQRRFLPRL SLLRTHLRTL RISALLPALA AALLCAPPAQ AETLRWARST DASTLDPHAL 
NNGPNHNLLH QIYEPLIIRT ADGKLLPTLA TSWALTADPS VWEFKLRKGV KFHDGSLFTA 
DDVLFSLRRA RSATSDMRSL LTSITDVTKV DAFTVHIRTN GPNPLLPASL INIQILSAAW 
AKAHGAEQPQ NALAKEENYA TRNANGTGPY VIASREQDTR TVLRQFPGYW GKGLFPLEID 
ELVYLPIKSQ ATRVAALLSG EVDFVQDLPI QDIARLSADP RFRINQAAEN RTIFLGLNVG 
AAPLSHSDVK DKNPLADLRV RQAFQLAIDR QAIQRAVMRG LSVPTNIIAP PFVHGYEKSF 
GAVGKADLVQ ARKLLAEAGY PNGFGITLHC TNDRYLNDEA ICQAIAGFLG RIGVKTAVSS 
RPLAIQTAAI NNQETDFYLY GWGVPTYDSA YVFDYLVHTR GKNGRGNTNA TRYSNAELDS 
QIVSLASEGD ARKRDATIHS IWSTVQKELI YLPLHDQIQT YAMVRKFDIP VNPSNTPYFK 
LFKQPGARQA AVAGAQ