Gene Saro_3235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3235
Symbol
ID	3917493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3456553
End bp	3457611
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	63%
IMG OID	640446019
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_498504
Protein GI	87201247
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTAACC TGCTTGTCAC CGGCGGCGCC GGCTTCATCG GCGGCAATTT CGTCCACTAT 
TGGGCGCAGC AGCACCCTGA CGACACGATC GTCGTGCTCG ACTGCCTGAC TTATGCTGGC 
AACCGGTCGA CCATTGCGGG GGTGGAACAG GCCGAACTCG TGGTGGGCGA CATTCGCGAC 
ACCGACCTCG TCGAGAAGCT GCTGCGCGAG CGGGACATCG CGACGCTCGT CCACTTCGCC 
GCAGAAAGCC ATGTCGACCG TTCGATTACC GGACCGGACG CCTTCATCGA AACCAATATC 
CTTGGGACCA ACAGCCTGCT CAAGGCCGCG CGCAAGGTCT GGCTGGACGA AGGTTCGGGC 
CGCGCCCACC GCTTCCACCA CATCTCGACC GACGAAGTAT ACGGGTCGCT CGGTCCCAGC 
GATCCGGCCT TCTCGGAAAC CACGCAGTAC CAGCCGAACT CGCCCTATTC GGCGTCGAAG 
GCCGCATCGG ACCACCTCGT GCGCGCCTAT CACCATACCT ATGGTCTGGA TGTGACGACG 
ACGAACTGTT CGAACAATTA TGGGCCGTAC CATTACCCGG AAAAGCTGAT CCCGCTGTTC 
ATCCTCAACG CGCTGTCGGG CAAGCCGCTG CCGATCTACG GCGACGGCAT GAACGTGCGC 
GACTGGCTTT ACGTCGAGGA CCACTGCCGG GGAATCGAGG CGGCGCTGAA GAACGGCAAG 
GCCGGCGAGA CCTACAACAT CGGTGGCGGC GAGGAACTGC CCAACATGGC GGTTATCGAC 
CGTATCTGCG CGGAAGTGGA TCGGGCATTC GTCGAAGTCG AGGGGCTTGC GGAGCGTTAT 
CCGGATGCGC CCGCCGCCAA GGGCCGGGCG ACCAGCGAAC TCAAGACCTT CGTCGAGGAC 
CGCAAGGGGC ACGATCGCCG ATATGCAATC GACGAGACCA AGGCGCGTGC GGAGCTGGGC 
TATGTGCCGC AGCACGACTT CGAGACAGGC CTTCGCGGCA CCCTGCGCTG GTACTTCGAC 
AACGAAGCGT GGTGGCGGCC GCTCAAGGAT CGCGGCTGA

Protein sequence

MSNLLVTGGA GFIGGNFVHY WAQQHPDDTI VVLDCLTYAG NRSTIAGVEQ AELVVGDIRD 
TDLVEKLLRE RDIATLVHFA AESHVDRSIT GPDAFIETNI LGTNSLLKAA RKVWLDEGSG 
RAHRFHHIST DEVYGSLGPS DPAFSETTQY QPNSPYSASK AASDHLVRAY HHTYGLDVTT 
TNCSNNYGPY HYPEKLIPLF ILNALSGKPL PIYGDGMNVR DWLYVEDHCR GIEAALKNGK 
AGETYNIGGG EELPNMAVID RICAEVDRAF VEVEGLAERY PDAPAAKGRA TSELKTFVED 
RKGHDRRYAI DETKARAELG YVPQHDFETG LRGTLRWYFD NEAWWRPLKD RG