Gene Dshi_3141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3141
Symbol	ugpC3
ID	5712197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3307792
End bp	3308850
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	65%
IMG OID	641269068
Product	sugar ABC transporter
Protein accession	YP_001534475
Protein GI	159045681
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.204703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGG TGATCCTCAA GGACCTGACC AAGCGGTGGG GCGATTTCGT CGGGGTGGAC 
AACCAGTCCC TGCATGTCCG CGACGAGGAA TTCCTGGTGC TGCTGGGCCC CTCGGGCTGC 
GGCAAGACCA CGACCATGCG GATGATCGCC GGGCTGGAGG ATCCGACCGA TGGCGAGATC 
TGGATCGGCG ACCGAATGGT CAACGACGAC CTGCCCAAGG ACCGCGACGT GGCCATGGTG 
TTCCAGAATT ACGGTCTCTA TCCGCATATG ACGATCTTCG AGAACATCGC CTATCCCCTG 
CGGGTGCGCG GCGTCGACAA GGCCGAGATT CCGCCGCGGG TCCAAAGGGC CGCCGAGCAG 
GTGGAACTGA CCAAGTTCCT CCACCGCAAG CCCAAGGCGC TCTCCGGCGG GCAGCGGCAG 
CGCGTGGCCC TGGCCCGCGC CATCGTGCGC AAGCCCAAGG TCTTCCTGAT GGACGAGCCG 
CTGTCGAACC TCGACGCCAA GCTGCGCGTC ACCATGCGGG CGGAGCTGAA ACATCTCAGC 
CGCGAGTTGC AGATCACCAC CGTCTACGTG ACCCACGACC AGATCGAGGC GATGACGCTG 
GCCGACCGGG TCGCGGTGAT GAAGCACGGC GTGATTCAGC AACTCGGCAC CCCGGACGAG 
ATCTACAACG ACCCCGCGAA CCTCTTCGTG GCGGGCTTCA TCGGCTCGCC CGCCATGAAC 
CTGATCAACG GCTCGGTCGA GGACGGCATG TTCGTGACCA CCGGTGGCAC CCGGCTGGTC 
AAGGTGCCCT CCCCGGACCG GGCGCGCGCG ATCCTCGGGG TGCGCGCCGA CGACATGCAG 
GTCCACGAAG CCGGGCAGGG CGATATCGAC GTGACCATCT ATGCCTTCGA GAATACCGGC 
GAGAGCACCC TTCTGACCGT GCAATGGGGC AAGCAGCGGG TGATCGCCCG CGGTGACCGG 
CACCTGCGCA AGGAACAGGA CGATGTCGTC GGCATCAGCC TGAACACCGA CCATTTGTAC 
CTCTTCGATC CGGACACCGA AGAGCGCATC AGGATGTAG

Protein sequence

MAEVILKDLT KRWGDFVGVD NQSLHVRDEE FLVLLGPSGC GKTTTMRMIA GLEDPTDGEI 
WIGDRMVNDD LPKDRDVAMV FQNYGLYPHM TIFENIAYPL RVRGVDKAEI PPRVQRAAEQ 
VELTKFLHRK PKALSGGQRQ RVALARAIVR KPKVFLMDEP LSNLDAKLRV TMRAELKHLS 
RELQITTVYV THDQIEAMTL ADRVAVMKHG VIQQLGTPDE IYNDPANLFV AGFIGSPAMN 
LINGSVEDGM FVTTGGTRLV KVPSPDRARA ILGVRADDMQ VHEAGQGDID VTIYAFENTG 
ESTLLTVQWG KQRVIARGDR HLRKEQDDVV GISLNTDHLY LFDPDTEERI RM