Gene Saro_0453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0453
Symbol
ID	3918321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	495805
End bp	496860
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	65%
IMG OID	640443182
Product	xylose isomerase-like TIM barrel
Protein accession	YP_495735
Protein GI	87198478
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000058237
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACCA TCAAGGGCCC GGGCATCTTC CTCGCCCAGT TCGCCGGCGA CAGCGCGCCG 
TTCAACAGCC TCGAGACCAT CGCCGACTGG GCCGCCGGCC TCGGCTACAA GGGCGTCCAG 
ATCCCGAGCT GGGACGGTCG CCTGTTCGAC CTCGAAAAGG CCGCGACCAG CAAGGATTAC 
TGCGACGAGG TCAAGGGCAT GCTGGCGGCC AAGGGCATCG AGATCACCGA GCTGTCGACT 
CACCTGCAGG GCCAGCTCGT GGCCGTGCAC CCTGCCTTCG ACGCGCAGTT CGACGGATTT 
GCTCCTGCCT CGGTCCACGG CAATCCCGCC GCGCGGCAGC AATGGGCGGT ACAACAGCTC 
AAGTTCGCGG CCCAGGCCAG CCGCAACCTC GGCCTCGCCG CCCATGCCTC GTTCTCGGGC 
GCTTTCGCAT GGCCCTACTT CTATCCCTGG CCGGCGCGTC CGGCCGGATT GGTCGAGGAT 
GCCTTCGATG AGTTGGCGCG GCGCTGGAAG CCGATCCTCG ACGTCTTCGA CGAGAACGGC 
GTCGACGTTG CCTACGAGAT CCATCCGGGC GAGGACCTGC ACGACGGGGT GACCTTCGAG 
ATGTTCCTCG AACGCGTCGG CAATCACCCG CGCGCGAACA TCCTCTACGA TCCGAGCCAC 
TTCGTGCTGC AGCAGCTCGA TTACCTGGCG TTCATCGACA TCTACCACGA GCGCATCAAG 
TGCTTCCACG TGAAGGACGC CGAGTTCCGC CCCAACGGTC GCTCGGGCGT CTATGGTGGC 
TACCAGTCCT GGGTGGACCG GCCGGGCCGC TTCCGCAGCC TGGGTGACGG TCAGGTCGAT 
TTCGCCGCGA TTTTCAGCAA GATGGCCGCC AACGACTATG CCGGCTGGGC CGTTCTCGAA 
TGGGAATGCG CGCTCAAGCA TCCCGAGGTC GGCGCGGCCG AAGGCGCGCC CTTCATAGAT 
CGCCACATCA TCAGGGTCAC CGAACACGCC TTCGACGATT TCGCCGCGGG CGGAGCTGAC 
CGGGCGCTCA ACGCAAGGCT CATGGGCATC GGCTGA

Protein sequence

MKTIKGPGIF LAQFAGDSAP FNSLETIADW AAGLGYKGVQ IPSWDGRLFD LEKAATSKDY 
CDEVKGMLAA KGIEITELST HLQGQLVAVH PAFDAQFDGF APASVHGNPA ARQQWAVQQL 
KFAAQASRNL GLAAHASFSG AFAWPYFYPW PARPAGLVED AFDELARRWK PILDVFDENG 
VDVAYEIHPG EDLHDGVTFE MFLERVGNHP RANILYDPSH FVLQQLDYLA FIDIYHERIK 
CFHVKDAEFR PNGRSGVYGG YQSWVDRPGR FRSLGDGQVD FAAIFSKMAA NDYAGWAVLE 
WECALKHPEV GAAEGAPFID RHIIRVTEHA FDDFAAGGAD RALNARLMGI G