Gene Ndas_5559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5559
Symbol
ID	9249462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	755050
End bp	756207
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID
Product	xylose isomerase
Protein accession	YP_003683444
Protein GI	297564471
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.324328
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCT ACCAGCCCGT GCCCGCGGAC AGGTTCACCT TCGGTCTGTG GACCGTGGGG 
TGGCGCGGGG TGAACACCTT CGGCGACCCC GTCCGCCCGG CGCTCGACCC GGTGGACGCC 
GTCCGCCGCC TCGCCGACCT CGGCGCGCAC GGGATCACCT TCCACGACGA CGACCTCATC 
CCGCCCGGCA GCTCCGACAC CGAGCGCGAG GACATCCTCA AGCGGTTCCG CGCGGCCCTG 
GACGAGACCG GGCTCAAGGT GCCGATGGCG ACCACCAACC TGTTCTCGGA CCCGGTGTTC 
CGCGACGGCG GGTTCACCTC CAACAGCCGC GACGTGCGCC GGTACGCCAT CCGCAAGGTC 
ATCCGCAACA TCGAGCTGGC CGTGTCGCTG GGCGCCGAGA CCTACGTGTG CTGGGGAGGC 
ATGGACGGCG CCGAGACCGA GGCGGGCAAG AACGACCACG CCGCCCTGGA CCGGCTGCGC 
GAGGCCTTCG ACATCCTGTG CGGCTACGTG CGCGAGCAGG GCCACGACCT GCGCTTCGCC 
CTGGAGCCCA AGCCCAACGA GCCGCGCGGC GACATCCTGC TGCCCACGGT GGGGCACGCC 
CTGGCCTTCA TCAACGAGCT GGAGCACCCC GAGATGGTGG GGGTCAACCC GGAGGTCGGC 
CACGAGCAGA TGGCCGGGCT GAACTTCGCG CACGGCGTCG CGCAGGCCCT GTGGGCGGGC 
AAGCTCTTCC ACATCGACCT CAACGGCCAG CGCGGGATCA AGTACGACCA GGACCTGCGC 
TTCGGCTCGG GCGACGTCAA GGAGGCGTTC TTCCTGGTGG ACCTGCTGGA GAGCGCGGGC 
TACGACGGCC CGCTGCACTT CGACTTCAAG ACGCCGCGCA CCGAGGACAT GAGCGGCGTG 
TGGGAGTCGG CCGCGGCCTG CATGCGCAAC TACCTCATCC TCAAGGAGAA GGCCAGGGCG 
TTCCGCGCCG ACCCCGAGGT GGTGGAGTCG CTCGCGGCCT CGCGCGTGCC CGAGCTGTCC 
CAGTCCACGC TGGGCGAGGG CGAGTCCCTG TCCGACCTGC TGGCCGAGGA GATCGACCTG 
GCCGAGGTCG GTGAGCGGGG CTACCACTTC GAGCGCCTGG ACCAGCTCGC CATGGAGCAC 
CTGTTCGGCC TGCGCTGA

Protein sequence

MSSYQPVPAD RFTFGLWTVG WRGVNTFGDP VRPALDPVDA VRRLADLGAH GITFHDDDLI 
PPGSSDTERE DILKRFRAAL DETGLKVPMA TTNLFSDPVF RDGGFTSNSR DVRRYAIRKV 
IRNIELAVSL GAETYVCWGG MDGAETEAGK NDHAALDRLR EAFDILCGYV REQGHDLRFA 
LEPKPNEPRG DILLPTVGHA LAFINELEHP EMVGVNPEVG HEQMAGLNFA HGVAQALWAG 
KLFHIDLNGQ RGIKYDQDLR FGSGDVKEAF FLVDLLESAG YDGPLHFDFK TPRTEDMSGV 
WESAAACMRN YLILKEKARA FRADPEVVES LAASRVPELS QSTLGEGESL SDLLAEEIDL 
AEVGERGYHF ERLDQLAMEH LFGLR