Gene Saro_0757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0757
Symbol
ID	3918581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	805250
End bp	806563
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	63%
IMG OID	640443489
Product	xylose isomerase
Protein accession	YP_496038
Protein GI	87198781
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCCG ATTACTTCGC CGATTTCCAG ACGGTCCGCT ACGAAGGGCC GGACAGCGAC 
AATGACTTTG CCTATCGCTG GTACGACAAG GACCGCGTGA TCCTGGGCAA GCGTATGGAG 
GATCACCTGC GCTTTGCCGT CTGCATGTGG CACACCTTCT GCTGGCCCGG CAGCGACGTG 
TTCGGTGCAG GCACTTTTAC CCGCCCCTGG CTGCAAGGCC CGATGGACGC GAGGAACGCA 
GCCGCCAAGC GCGAGGCTGC GCTCGCCTTC GTCGAGAAGC TCGATGTTCC CTTCTACTGC 
TTCCATGACG TCGACGTGAT GGCCGAGGCC GAAGGCATTG GCGAATTCCG ATCGAGCTTT 
GCCGAAGCGG TCGATCATCT CGAGGAGCTG CAGGGCAAGC ACGGCCGCAA GCTGCTGTGG 
GGTACCGCCA ATCTGTTCGG TCACCCTCGC TACATGGCAG GCGCCGCGAC CAATCCCGAT 
CCGGAAGTCT TCGCCTGGGG CGCAAGCCAG GTGCGCGACG CGCTGGAAGC GACCCATCGC 
CTGGGCGGCG CGAACTACGT GCTGTGGGGC GGCCGCGAAG GCTATGACAG CATCCTCAAC 
ACCGAGATCG GGATCGAGCA GGAGAACTTC GGGCGCTTCC TGTCGCTGGT CGTGGATCAC 
AAGCATCGCA TCGGCTTCAA GGGCACGATC CTCATCGAGC CCAAGCCGCA CGAGCCGACC 
AAGCACCAGT ACGATTTCGA CACCCAGACC GTATTCGGCT TTCTCAAGCG CTTCGGGCTG 
GAAAGCGAAG TGAAGGTGAA CATCGAGGCG AATCATGCAA CGCTCTCGGG CCATACTTTC 
GAACACGAAC TGGCCATGGC GCGCGCTCTC GGCATTCTCG GCTCGATCGA CGCCAACCGT 
GGCGACCACC AGAACGGCTG GGATACCGAC CAATTCCCCA ATTCGGTGGA AGAACTGACG 
CTTGCCATGC TTGAACTGAT CCGTGCGGGC GGCTTCACCG ATGGCGGCTT CAATTTCGAC 
GCCAAGGTGC GCCGCCAGTC GATCGACGCG GCCGACCTGT TCCACGGCCA CATCGGCGGC 
ATCGACACCA TCGCGCACGC GCTGGTCAAG GCGGCGGCGC TGATCGAGGA CGGCAAGCTT 
GATGCCTTCC GCGCCGAACG CTACGCGGGG TGGCAGGGGG AACTCGGTCG CAAGATCCAC 
GCAGACGGCA CCACGCTGGC CGACATCGCC GACATCGCGG TAGCGCGCGA CCTCGCGCCG 
GTGCGCAGGT CGGGCAGGCA GGAGTGGTGT GAAAACCTGA TCAACCGCGT TTGA

Protein sequence

MSADYFADFQ TVRYEGPDSD NDFAYRWYDK DRVILGKRME DHLRFAVCMW HTFCWPGSDV 
FGAGTFTRPW LQGPMDARNA AAKREAALAF VEKLDVPFYC FHDVDVMAEA EGIGEFRSSF 
AEAVDHLEEL QGKHGRKLLW GTANLFGHPR YMAGAATNPD PEVFAWGASQ VRDALEATHR 
LGGANYVLWG GREGYDSILN TEIGIEQENF GRFLSLVVDH KHRIGFKGTI LIEPKPHEPT 
KHQYDFDTQT VFGFLKRFGL ESEVKVNIEA NHATLSGHTF EHELAMARAL GILGSIDANR 
GDHQNGWDTD QFPNSVEELT LAMLELIRAG GFTDGGFNFD AKVRRQSIDA ADLFHGHIGG 
IDTIAHALVK AAALIEDGKL DAFRAERYAG WQGELGRKIH ADGTTLADIA DIAVARDLAP 
VRRSGRQEWC ENLINRV