Gene Sros_8557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8557
Symbol
ID	8671891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	9440933
End bp	9442063
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	77%
IMG OID
Product	glucose kinase
Protein accession	YP_003343942
Protein GI	271969746
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGAT TAGTGCTTGC TGTCGACATC GGCGGGACGA AGTTCGCCGT CGCCCTGGTG 
GATTCCGACG GGAACGTGCG GACTGCCCGC CGCGCGGCGA CGCCGCCGGG TGGCGACGCG 
CGGACCCTGT GGAAGGCGCT CGGCGAGCTG GTCGACTCCC TGCTGGACGG CGCCGCGGCC 
GACGGCCTGA TCAACGGCGA CGCCGCTGCC GGCGGCGCGG TCGCCGGTGT CGGAATCGGC 
TGCGGCGGCC CGATGACCTG GCCGGAGGGG GCCGTCTCCC CGCTGAACAT GCCGGGCTGG 
CGAGGCTTCC CGCTGCGCGC GAGGCTCGCC GAGCGGTTCC CCGGCGTGCC GGTCCGCATC 
CACAACGACG CCGTCTGCCT GGCCGTCGCC GAGCACTGGC GGGGGGCCGG GCGGGGCAGC 
GCCAACATGC TCGGCATGGT CGTGTCCACG GGGGTGGGCG GCGGGCTGAT CCTGGGCGAC 
CGGCTGATCG ACGGCGGCAG CGGCAACGCC GGGCACATCG GGCACATCGT GGTCGACCCC 
GGCGGGCCCC CCTGCGGATG CGGCGGCCGG GGCTGCCTGG AGGCGGTCGC CCGCGGTCCG 
GGCCTGGCCG CCTGGGCGGT CGAGCAGGGC TGGAACCCGG GCGCCGCCGG CCCGCCCGCC 
GCCGCGACCG CACCGCCCGG CGAAGGGCCA CGGACCTCCG GCGGTACGGC CGCGACCTCC 
GGTGGGGGGA ACGGCGCCCT CAACGGCGAG CCCGGGGATC CGGGCGCCGG GTCCGCCTAT 
GCCGGGTCCG GCTATGTGGA GGCGGCGGTG GCCAGCGGGC GGCAGCTCGC CCTGGACGCG 
GAGGCGGGCG ACGAGATCGC CCTCGCCGCC ATGAGCCGTG CCGGCCGGGC CCTGGGCCTG 
GCCATCGCCT CGGCCACGAA CCTCTGTGAC CTGGACGTCG TCACCATCGG CGGCGGCCTT 
TCCCAGGCCG GTCCGCTGCT GTTCGATCCG CTGGAGGCCA CCCTCCGGGA CCACACCCGG 
ATGGAGTTCG CCCGGCGGGT CCGGGTCGTC CCGGCCTCCC TCGGCCAGGA CGCCGGCCTG 
GTCGGCGCCG CCGCCCTGAT CCTCGCCACC GACCGCTACT GGACCCACTG A

Protein sequence

MSGLVLAVDI GGTKFAVALV DSDGNVRTAR RAATPPGGDA RTLWKALGEL VDSLLDGAAA 
DGLINGDAAA GGAVAGVGIG CGGPMTWPEG AVSPLNMPGW RGFPLRARLA ERFPGVPVRI 
HNDAVCLAVA EHWRGAGRGS ANMLGMVVST GVGGGLILGD RLIDGGSGNA GHIGHIVVDP 
GGPPCGCGGR GCLEAVARGP GLAAWAVEQG WNPGAAGPPA AATAPPGEGP RTSGGTAATS 
GGGNGALNGE PGDPGAGSAY AGSGYVEAAV ASGRQLALDA EAGDEIALAA MSRAGRALGL 
AIASATNLCD LDVVTIGGGL SQAGPLLFDP LEATLRDHTR MEFARRVRVV PASLGQDAGL 
VGAAALILAT DRYWTH