Gene Sros_0353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0353
Symbol
ID	8663621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	340472
End bp	341623
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	69%
IMG OID
Product	Xylose isomerase
Protein accession	YP_003336128
Protein GI	271961932
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.539165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACT ACACGCCCAA GCCTGAGGAC CGCTTCACCT TCGGGCTGTG GACCGTCGGC 
TGGCAGGCCC GTGACCAGTT CGGAGACGCG AGCCGTGCCC CGCTCGACCC GGTGGAGAGC 
GTCCACCGCC TCGCCGAGCT CGGCGCGTAC GGCGTCACCT TCCACGACGA CGACCTGCTG 
GCCGTCGAGC CGGACCGGGA CAAGGCCGTC GAGCGTTTCA AGAAGGCCCT GGCCGAGACC 
GGCCTCAAGG TCCCCATGGC CACCACGAAC CTGTTCACCC ACCCCGTCTT CAAGGACGGC 
GGGTTCACCA GCAACGACCG CGACGTGCGC CGCTACGCCC TGCGCAAGGT GATGCGCAAC 
GTCGACCTGG CAGCCGAGCT CGGCGCGACC ACCTACGTCT GCTGGGGCGG CCGCGAGGGC 
GCCGAGTCAG GGGCCGCCAA GGACATCAGG GCCGCGCTCA GCCGTTACAA GGAGGGCATG 
GACCTGCTGA CCTCCTACGT GATCGACCGG GGCTACGACA TCAGGTTCGC CATCGAGCCC 
AAGCCGAACG AGCCGCGCGG CGACATCCTG CTCCCGACCG TCGGCCACGC GCTCGCCTTC 
ATCAACGAGC TGGAGCACTC CGAGCGGGTC GGCCTCAACC CGGAGGTCGG CCACGAGGAG 
ATGGCCGGGC TCAACTTCGC GCACGGCATC GCGCAGGCGC TCTGGCACGG CAAGCTCTTC 
CACATCGACC TCAACGGCCA GCACGGCCCC CGGTTCGACC AGGACCTCGT CTTCGGCCAC 
GGCGACGTGA AGAACTCCTT CTTCCTGGTG GACCTGCTGG AGAACGGCGG CTACGACGGC 
CCCCGGCACT TCGACTACAA GCCGCTGCGC ACCGAGGACG CCGAGGACGT CTGGGTCTCG 
GCCGCGGCCA ACATGCGCAC CTACCTGATC CTCAAGGAGA AGGTGAAGGC CTTCCACGCC 
GACCCCGAGG TCGTCGAGGC GCGCGCCGCC AGCAGGGTCG CCGAGCTGTC CGAGCCCACG 
CTGGCCCCCG GTGAGACGCT TGAGGACCTG CACCGCGACG ACTTCGACGT CGACCGGGCC 
GCCGCGCGAG GCTTCCACTT CTCCCGGCTG AACCAGCTCG CCCTGGAGCA CCTCCTCGGA 
GTCCGGGGAT GA

Protein sequence

MSDYTPKPED RFTFGLWTVG WQARDQFGDA SRAPLDPVES VHRLAELGAY GVTFHDDDLL 
AVEPDRDKAV ERFKKALAET GLKVPMATTN LFTHPVFKDG GFTSNDRDVR RYALRKVMRN 
VDLAAELGAT TYVCWGGREG AESGAAKDIR AALSRYKEGM DLLTSYVIDR GYDIRFAIEP 
KPNEPRGDIL LPTVGHALAF INELEHSERV GLNPEVGHEE MAGLNFAHGI AQALWHGKLF 
HIDLNGQHGP RFDQDLVFGH GDVKNSFFLV DLLENGGYDG PRHFDYKPLR TEDAEDVWVS 
AAANMRTYLI LKEKVKAFHA DPEVVEARAA SRVAELSEPT LAPGETLEDL HRDDFDVDRA 
AARGFHFSRL NQLALEHLLG VRG