Gene Sros_3959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3959
Symbol
ID	8667249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4408085
End bp	4409515
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	72%
IMG OID
Product	6-phosphogluconate dehydrogenase
Protein accession	YP_003339612
Protein GI	271965416
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.111769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCAGG CACAGATCGG TGTTACCGGC TTGGCGGTCA TGGGCGCGAA CCTCGCCCGC 
AACCTGGCAA GACACGGACA CGCAGTAGCC GTACACAACA GGTCGCAGTC CCGGACCAAG 
GCACTGATGG AGCAGCACGG GGACGAGGGC ACGTTCGTCG CCTGTGAGAC TCCGGAGGAG 
CTGGTCGCGG CGCTGGAGCG CCCCCGGCGC ATCCTCATCA TGGTGAAAGC GGGCGCCCCG 
ACCGACGCGG TGATCGAGGA GTTCGCCCCC CTGCTGGAGC CGGGCGACAT GCTCGTGGAC 
GGCGGGAACG CGCACTTCCT CGACACCCGC AGGCGGGAGG CGGCGCTGCG CGAGCGGGGC 
ATCCACTTCG TCGGGGCGGG GGTGTCCGGC GGCGAGGAGG GGGCGCTGCT CGGACCGAGC 
ATCATGCCGG GCGGCTCCCG GGAGTCCTAC GAGGCGCTGG GCCCGCTGCT GGAGGACATC 
GCCGCGAAGG TGGACGGCGT GCCCTGCTGT ACCCACATCG GCCCCGACGG CGCCGGGCAC 
TTCGTCAAGA TGGTGCACAA CGGCATCGAG TACGCCGACA TGCAGCTCAT CGCCGAGGCC 
TACGACCTGC TCAGGCAGGG GCTCGGCCTG AGCCCGGCGG AGCTCGCCGA CGTCTTCGAG 
GAGTGGAACA AGGGCGAGCT GTCCTCCTAC CTCATCGAGA TCACCGCCGA GGTGCTCCGG 
CAGGTCGACG CCACCACCGG CAGACCGCTC GTGGACGTCA TCGCCGACCG GGCCGAGCAG 
AAGGGCACCG GCCGGTGGAC GGTGCAGATC GCGCTGGATC TGGGCGTCCC GGTGAGCGGC 
ATCGCCGAGG CGGTGTTCGC CCGCTCGGTC TCCGGTCACG CGGATCTGCG GGAGGCCGCG 
CGCGGCCTGC CCGGCCCCTC GGGCGTGCCG GCCGGGCCGG TCGGCGAGGG GTTCGCGGAG 
GACGTGCGGC GGGCGCTGTA CGCATCGAAG ATCATCGCTT ACGCGCAGGG GTTCGACCAG 
ATCAGGGCCG GGAGCGCGGA GTACGGCTGG GACGTGGACC CGGGCTCGCT GGCCACGATC 
TGGCGCGGCG GCTGCATCAT CCGGGCCGTC TTCCTCGACC GCATCCGTGA GGCCTACGAG 
GGGGAGACCC CGCCCGTGAC CCTGCTGACC GCCCCCCTGT TCGCCGAGGC CCTGGGCCTG 
GCGCAGGATT CGTGGCGGCG GGTGGTGGCG AAGGCGGCGG AGCTGGGCAT CCCGGCGCCC 
GGTTTCTCGA CCGCGCTGGC CTACTACGAC TCCCTGCGGG CCGAGCGCCT GCCCGCGGCC 
CTGATCCAGG GCCAGCGGGA CTTCTTCGGC GCGCACACCT ACCAGCGGAC GGACCGGGAG 
GGCTCCTTCC ACACCCTGTG GTCCGGCGAC CGCACGGAGA TCGGGGCCTG A

Protein sequence

MAQAQIGVTG LAVMGANLAR NLARHGHAVA VHNRSQSRTK ALMEQHGDEG TFVACETPEE 
LVAALERPRR ILIMVKAGAP TDAVIEEFAP LLEPGDMLVD GGNAHFLDTR RREAALRERG 
IHFVGAGVSG GEEGALLGPS IMPGGSRESY EALGPLLEDI AAKVDGVPCC THIGPDGAGH 
FVKMVHNGIE YADMQLIAEA YDLLRQGLGL SPAELADVFE EWNKGELSSY LIEITAEVLR 
QVDATTGRPL VDVIADRAEQ KGTGRWTVQI ALDLGVPVSG IAEAVFARSV SGHADLREAA 
RGLPGPSGVP AGPVGEGFAE DVRRALYASK IIAYAQGFDQ IRAGSAEYGW DVDPGSLATI 
WRGGCIIRAV FLDRIREAYE GETPPVTLLT APLFAEALGL AQDSWRRVVA KAAELGIPAP 
GFSTALAYYD SLRAERLPAA LIQGQRDFFG AHTYQRTDRE GSFHTLWSGD RTEIGA