Gene Dshi_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3045
Symbol
ID	5710897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	3213310
End bp	3214326
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	69%
IMG OID	641268972
Product	putative glycosyl transferase
Protein accession	YP_001534379
Protein GI	159045585
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.109272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.871174
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGT CACCCTCCGC CCCCCTGCCC GCCGAGATCC GCGCCACGCG GCCCCTGACC 
GTGGTGGTCG CCGCCTGCAC AAGGCGCAGG CCGAAGATGC TGGAGCGGTT GCTTGGCTCC 
TACGCCGCGC TGGAGGTGCC GGAGAACGTC ACGCCGATCT TCCTCGTGGT CGAGAATGAC 
GAGACCGCCC GGAGTACCGA GGTGATCGCG GCCTTCGAGG ACAAGCTGCC CGGGCCTCTG 
CACGCCGTTC TGGAAACCGT GCCGGGTATC CCCATGGCAC GCAATCGCGG GCTGGTGGAG 
GCCGCCGCCC TCGGCGCGGA CCTGGTGCTC TATGTCGATG ATGACGAGAC CGTGGCGCCC 
GACTGGCTGA CCGAGATCGT GGCCGCCTGG CGCGGCGGCA CGGCCGAGCT GATCGGCGGC 
CCCGTGCGGC TGACCGAGCC GCAGGCACCT CTCAGCGGAC CCCAGAAAAC CGTCTTCGAT 
GGCATGGTCA AACGCTTCGC CACCAAGGAG GCCCGCGCGG TCGACCGCAT GAAGGCCGGG 
CAGGCCGACC GGGTGACCGT GGTCACGAAC AACTGGCTTT GCGACATGCG GCTGGTGCGC 
GACCTCGGCC TGCGCTTCGA CGAGGCGCTG CAATTCACCG GCGGGTCCGA CACCAAGTTC 
TTCCGCGACG CCCGCGCCAA GGGGGTCGAG ACCGGCTGGG CCCCTGCCGC CATCGTTTAT 
GAAACCGTCC CGCCCGAACG GCTCACCTTG CCCTATCAGT ACACGCGCGG CCGGGACCAG 
TCGGCCACCT CCTTCGGCCA GAAAGTTGCC GAAGGCAAAT GGGCCAGTGC GGCCACCAGC 
ATCCTGATTT TGCTGCCGCT CAAGGCGCTG TCGCTGGTCC TGATCGCCCT GTCGCTGCCG 
GTGACGCGCA GCTACGGGCT GGTATCGCTC TTCCGGCAGG CAGGCTGGAT CGCCGGACGC 
CTGACCCGGC TCTTCGGGCG CGCCTCGAAG CTCTACGTCA AGACGACGGG AAACTGA

Protein sequence

MSQSPSAPLP AEIRATRPLT VVVAACTRRR PKMLERLLGS YAALEVPENV TPIFLVVEND 
ETARSTEVIA AFEDKLPGPL HAVLETVPGI PMARNRGLVE AAALGADLVL YVDDDETVAP 
DWLTEIVAAW RGGTAELIGG PVRLTEPQAP LSGPQKTVFD GMVKRFATKE ARAVDRMKAG 
QADRVTVVTN NWLCDMRLVR DLGLRFDEAL QFTGGSDTKF FRDARAKGVE TGWAPAAIVY 
ETVPPERLTL PYQYTRGRDQ SATSFGQKVA EGKWASAATS ILILLPLKAL SLVLIALSLP 
VTRSYGLVSL FRQAGWIAGR LTRLFGRASK LYVKTTGN