Gene Sros_5418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5418
Symbol
ID	8668712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5936309
End bp	5938624
Gene Length	2316 bp
Protein Length	771 aa
Translation table	11
GC content	69%
IMG OID
Product	Phosphoketolase
Protein accession	YP_003340921
Protein GI	271966725
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.308896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAC TCGCACACGT CGACGCCTAC TGGCGGGCGG CCAACTACCT GTCGGTCGGC 
CAGATCTACC TGCTGGACAA TCCGCTGCTG GCCGAGCCGC TGGCCCCCGA GCACATCAAG 
CCACGCCTCC TCGGGCACTG GGGCACCACT CCGGGGCTGA ACTTCTGCTT CGCCCACCTC 
AACCGGATCA TCACCGAGCG CGACCAGGAC ATGATCTACA TCGTCGGGCC CGGCCACGGT 
GGTCCGGCGG CGGTCGCCCA CGCCTGGCTG GAGGGCTCCT ATACAGAGAA ATATCCGGAT 
ATTGGGCAGG ACGCCGTCGG CATGCAGCGG CTGTTCCGGC AGTTCTCCTT CCCCGGCGGC 
ATCCCCAGCC ACGTCGCCCC CGAGGTCCCG GGCTCCATCC ACGAGGGCGG TGAGCTCGGC 
TACTCGCTGG CCCACGCCTA CGGCGCCGCC TTCGACAACC CGCACCTGGT GGTGGCCTGC 
GTCATCGGCG ACGGCGAGGC CGAGACCGGG CCGCTGGCGG CCGGCTGGCA CTCCGGCAAG 
TTCCTCAACC GCGAGCACGA CGGGGTCGTG CTGCCGATCC TGCACCTGAA CGGCTACAAG 
ATCGCCAACC CGACCGTCCT CGCCCGCATC CCCGAAGAGG AGCTGGTCAA GCTCATCGAG 
GGGTACGGCT ACCGCCCGCA CATCGTCTCC GGCGACGACC CGGCGGTCAT GCACGGACTG 
ATGGCCGAGA CCCTCGAGGT GGTCTTCGAC GAGATCGCCG AGTTCAAGGA CGGCCGCGCC 
GAGCGCCCGC CGATGATCGT GCTGCGCACG CCCAAGGGGT GGACCGGCCC GCGCGAGGTG 
GACGGCCTGC CGGTCGAGGG CACCTGGCGG GCTCATCAGG TGCCGCTGTC GGCGGTCCGC 
CAGAACGCCG AGCACCGGGC GATGCTGGAG GAGTGGATGC GCTCCTACCG GCCCGCCGAG 
CTCTTCGACG ACCGGGGGCG GCCCGTCGCG GAGATCCTGC GGACGGTGCC GCAAGGCCCG 
CGCCGGATGA GCGCCAACCC GCACGCCAAC GGCGGCGAGC TGCTCAAGCC GCTGGCGCTG 
CCCGACTTCC GCGACCACGC CGTCGAGGTC AAGGCTCCCG CCGCGCAGTC GAGCGAGCCG 
ACCAAGGTCC TCGGGCAGTT CCTGCGCGAC GTCATCGCCG CCAACCCGGA CAACTTCCGG 
CTGATGGGGC CGGACGAGAC CGCCTCCAAC CGGCTGTCGG CCGTGTTCGA GGTCACCGAC 
CGCGTGTGGG ACGCCGAGAC GCTGCCCACG GACGAGAATC TCGGCCCGGA CGGCCGGGTC 
ATGGAGGTGC TCAGCGAGCA CCTGTGCCAG GGCTGGCTGG AGGGCTACCT GCTGACCGGC 
CGCCACGGCC TGTTCAACTG CTACGAGGCG TTCATCCACA TCGTCGACTC GATGTTCAAC 
CAGCACGCCA AGTGGCTGGA GTCGTCCCAC AAGATCACCT GGCGGCGTCC GGTCGCCTCG 
CTGAACTACC TGCTGTCGTC GCACGTGTGG CGGCAGGACC ACAACGGCTT CAGCCACCAG 
GATCCCGGCT TCATCGACGT GGTGATGAAC AAGAAGGCCT CGGTGGTGCG GATCTACCTG 
CCGCCGGACG CCAACACCCT GCTGTCGGTC GGCGACCACT GCCTGCGCTC GCGTGACTAC 
GTCAACCTCG TCGTGGCCGG CAAGCAGCCG GTGCTGGATC TGTTCACGAT GGAGGAGGCG 
ATCGCGCACT GCACCCGTGG CCTGGGCATC CTGGAGTGGG CCTCCACCGA CGCGGGAGCC 
GAGCCCGACG TGGTGCTGGC CTGCGCCGGA GACGTGCCGA CGCTGGAGAC CCTCGCCGCC 
GCCGCGCTGC TGCGCGAGCA CCTGCCCGAG CTGAAGGTCC GCGTGGTCAA CGTGGTGGAC 
CTGATGCGGC TGCAGCCGCC GTCGGAACAC CCGCACGGCA TGTCGGACGC CGAGTTCGAC 
ACCCTCTTCA CCGCCGACAA GCCGATCATC TTCAATTTCC ACGGCTATCC CTGGTCGATC 
CACCGGCTGA CCTACCGGCG GCGCGGCCAC CACAACATCC ACGTGCGCGG CTACAAGGAG 
GAGGGCACCA CCACCACGCC GTTCGACATG GTGATGCTCA ACGACATCGA CCGCTTCCAC 
CTGGTGATGG ACGTCGTCGA CCGGGTGCCG GGTCTGGGCG CCAAGGCCGC GCACCTGCGC 
CAGCAGATGG TCGACGAGCG GCTGCGCGCC CGCGCCCACA CCCGCGAGTA CGGCGAGGAC 
CCGGCCGAGA TCCGCGACTG GACCTGGCCC TACTGA

Protein sequence

MDALAHVDAY WRAANYLSVG QIYLLDNPLL AEPLAPEHIK PRLLGHWGTT PGLNFCFAHL 
NRIITERDQD MIYIVGPGHG GPAAVAHAWL EGSYTEKYPD IGQDAVGMQR LFRQFSFPGG 
IPSHVAPEVP GSIHEGGELG YSLAHAYGAA FDNPHLVVAC VIGDGEAETG PLAAGWHSGK 
FLNREHDGVV LPILHLNGYK IANPTVLARI PEEELVKLIE GYGYRPHIVS GDDPAVMHGL 
MAETLEVVFD EIAEFKDGRA ERPPMIVLRT PKGWTGPREV DGLPVEGTWR AHQVPLSAVR 
QNAEHRAMLE EWMRSYRPAE LFDDRGRPVA EILRTVPQGP RRMSANPHAN GGELLKPLAL 
PDFRDHAVEV KAPAAQSSEP TKVLGQFLRD VIAANPDNFR LMGPDETASN RLSAVFEVTD 
RVWDAETLPT DENLGPDGRV MEVLSEHLCQ GWLEGYLLTG RHGLFNCYEA FIHIVDSMFN 
QHAKWLESSH KITWRRPVAS LNYLLSSHVW RQDHNGFSHQ DPGFIDVVMN KKASVVRIYL 
PPDANTLLSV GDHCLRSRDY VNLVVAGKQP VLDLFTMEEA IAHCTRGLGI LEWASTDAGA 
EPDVVLACAG DVPTLETLAA AALLREHLPE LKVRVVNVVD LMRLQPPSEH PHGMSDAEFD 
TLFTADKPII FNFHGYPWSI HRLTYRRRGH HNIHVRGYKE EGTTTTPFDM VMLNDIDRFH 
LVMDVVDRVP GLGAKAAHLR QQMVDERLRA RAHTREYGED PAEIRDWTWP Y