Gene Daci_5086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_5086
Symbol
ID	5750697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	+
Start bp	5640154
End bp	5641380
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	641300210
Product	major facilitator transporter
Protein accession	YP_001566100
Protein GI	160900518
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.90358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0097128
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACAAAA ACAACCAACC CATGTCCATG GTGCAGATAC TGCTGTGCGG GGGCGCAGTC 
GTGACGCTGT CCATGGGAAT CCGCCACGGC TTCGGCCTGT GGCTGCAGCC CATCACCCAG 
GAGATGGGCT GGACGCGCGA GTCCTTCGCG CTGGCCATCG CCATCCAGAA CCTGTCCTGG 
GGCGTGCTCG GCATCTTCGG CGGCATGCTG GCCGACCGCT TCGGCGCCTT CCGCGTGCTC 
CTGGTGGGCG CGCTGCTGTA TGCGCTGGGC CTGGCCGGCA TGGCCATGGC GCCCACGACA 
ACCTGGTTCG CCCTGACGGC CGGCGTGGTG ATCGGCGCAG CCCAGGCAGG CACCACCTAT 
GCCGTGATCT ACGGTGTGCT GGGCCGCCAG ATTCCCGTGG CGCGGCGCAG CTGGGCCATG 
GGCGTGACGG CGGCGGCGGG CTCCTTCGGC CAGTTCTTCA TGGTGCCCGT GGAAGGCAGC 
CTGATTTCGA ACTTCGGCTG GTCCAACGCC CTGCTGCTGC TGTCGCTGTG CGCGCTGATG 
ATCATTCCGC TGGCCTTCGG CCTGCGCGAG CCGGGCTTCC AGCCCGGCAA CGCCCGTCCC 
GTGCGCGACC AGAGCGCGGG CCAGGCCGTC GCCGAAGCGC TGCGCACGCC CAGCTTCGTG 
CTGCTGACGG CCGGCTACTT CGTCTGCGGC TTCCAGGTGA TGTTCATCGG CGTGCACATG 
CCCAGCTACC TCAAGGACTA CGGCCTGGCA CCGCAGGTGG CCAGCATCTC GCTGGCGCTG 
GTGGGGCTGT TCAACATCGT TGGCACCTAC GTGGCCGGCA ACCTGGGCCA GCGCCTGCCC 
AAGCGCTACC TGCTGTCCAC CATCTACTTC ACGCGCTCGG TGGTGATCGT GCTCTTCCTG 
CTGGCGCCGC TGACGCCGTG GTCGGTCTAC ATCTTCTCTG CCGCCATGGG CCTGCTGTGG 
CTGTCCACCG TGCCGCTGAC CAACGCCACC GTGGCCCAGA TCTTCGGCGT GCAGCATCTG 
TCCATGTTGA GCGGCATGGT GTTCTTCAGC CACCAGGTGG GCAGCTTCCT GGGCGTCTGG 
CTGGGCGGCT ATCTCTATGA CCACACGGGC AGCTACCAGG TGGTCTGGTA CCTGGCCATC 
GGCCTGGGCG TGGCCGCCGG CCTGCTGAAC CTGCCCATAC GCGAAGCCCC GGTGGCACGG 
TTGCGCGCGG CCCAGGCCGC TGCCTGA

Protein sequence

MHKNNQPMSM VQILLCGGAV VTLSMGIRHG FGLWLQPITQ EMGWTRESFA LAIAIQNLSW 
GVLGIFGGML ADRFGAFRVL LVGALLYALG LAGMAMAPTT TWFALTAGVV IGAAQAGTTY 
AVIYGVLGRQ IPVARRSWAM GVTAAAGSFG QFFMVPVEGS LISNFGWSNA LLLLSLCALM 
IIPLAFGLRE PGFQPGNARP VRDQSAGQAV AEALRTPSFV LLTAGYFVCG FQVMFIGVHM 
PSYLKDYGLA PQVASISLAL VGLFNIVGTY VAGNLGQRLP KRYLLSTIYF TRSVVIVLFL 
LAPLTPWSVY IFSAAMGLLW LSTVPLTNAT VAQIFGVQHL SMLSGMVFFS HQVGSFLGVW 
LGGYLYDHTG SYQVVWYLAI GLGVAAGLLN LPIREAPVAR LRAAQAAA