Gene Dshi_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1994
Symbol
ID	5712989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2111233
End bp	2112393
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	67%
IMG OID	641267918
Product	putative glycosyltransferase
Protein accession	YP_001533334
Protein GI	159044540
COG category	[R] General function prediction only
COG ID	[COG4671] Predicted glycosyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0252697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.74194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCCA ACCGTATCGC CCTTTATTCC CATGACACGC TCGGTTTTGG CCACTTTCGG 
CGCAACCTGA TGCTGGCCAA GAAGCTGCGC GCGTTGCCGT CGAAGCCGGA TGTGATGCTG 
GTGGCCGGGA CCTACGAAGT CGGGGCCTTT GACATTCCCG ACGGCATCGA GGTTCTGACG 
CTGCCGGCCT ATGCCAAGCA CGCGGATGGC CAATACACTG CCCGGCGCCT GAACATGGAG 
CTGTGCGAGC TGCGCGCCCT GCGCGAGGCG ATCCTGGCGG CCACCTTGAA GCGGTTCGCG 
CCCGACCTGC TGATCGTGGA CAATGTCCCG CTTGGCGCCC AGGGGGAACT GGAGGGGCCG 
CTGCGCAAGC TTCGCAAACG GGGCAAGACG CGGCTTGTGC TGGGGTGTCG CGATATCCTC 
GATGATCCGG CGACCGTGCG GCGGCAATGG CTGCGCCAGC GCCATGTCGA GACCATCAAC 
ACCTATTTCG ATGCGGTGTG GATCTATGGG GACCCGGCCG TCTATGACGT GTTCAAGGAC 
TGCGATCTGA CCGGCATCAC CGCCGAGATC GTGCATACCG GCTACTTGTT GAAGGACTGG 
CCCGCCGAGG TCGCGCCGAG TGGTGGGGAG GCGCCGCTGG TTCTGTGCAC CGTGGGCGGC 
GGGCGCGACG GTCTCGACCT GTGCAAGGCG TTCGCGGCGG CGGAGCTTCC GGCGGGTCAC 
CGCGGCATCA TCGTGCCGGG CACGCAAATG GATGCGGACG CCCTGGCCCG TATCCGGCAG 
ATCGCGGCGG GCAATCGCGG CATGCAGGTG GTGCCCTTCG TGCCGGACCT CGTGCCGCTG 
ATGGCCGCGG CGCGCCGGAT CGTGGCGATG GGGGGCTACA ACACGACCTG CGAGATCCTG 
GCCCTGAAGA AACCGGCGCT GATCGTGCCA AGGGTCGCGC CGCGCACGGA GCAGCTGATC 
CGCGCGCGCG CCCTGAGCGA CCGCGGGCTT GTCGATATCT GCCACCCGAG GGGGCTGTCC 
CCGACGGCCT TGTCGGAGTG GATGGCGCGC CCGATCCCGC GCGCGGCCTC TCATGGGATC 
AGGACCGATG GGCTGGCCTC TGTTGCCGCC CTCGCCCAGT CCGCGCTTTA CCCCGATTAC 
CAACAGATCG CCGCAGAGTG A

Protein sequence

MQANRIALYS HDTLGFGHFR RNLMLAKKLR ALPSKPDVML VAGTYEVGAF DIPDGIEVLT 
LPAYAKHADG QYTARRLNME LCELRALREA ILAATLKRFA PDLLIVDNVP LGAQGELEGP 
LRKLRKRGKT RLVLGCRDIL DDPATVRRQW LRQRHVETIN TYFDAVWIYG DPAVYDVFKD 
CDLTGITAEI VHTGYLLKDW PAEVAPSGGE APLVLCTVGG GRDGLDLCKA FAAAELPAGH 
RGIIVPGTQM DADALARIRQ IAAGNRGMQV VPFVPDLVPL MAAARRIVAM GGYNTTCEIL 
ALKKPALIVP RVAPRTEQLI RARALSDRGL VDICHPRGLS PTALSEWMAR PIPRAASHGI 
RTDGLASVAA LAQSALYPDY QQIAAE