Gene Sros_6037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6037
Symbol
ID	8669331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6615463
End bp	6616650
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID
Product	Phosphoglycerate kinase
Protein accession	YP_003341513
Protein GI	271967317
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.873832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGATC TGTCTGAGCT CGATGTGAAG GGTCGGCGCG TCCTCGTCCG CGCCGACCTC 
AACGTCCCCC TCGACGGGGA CGTCATCACC GACGACGGAC GCATCCGGGC CTCGGTGCCG 
ACGATCAGGG AGCTCGCCGA CAAGGGCGCG CGCGTCGTCG TCTGCGCCCA CCTGGGGCGT 
CCGAAGGGCG AGCCGAACCC GAAATACTCG CTGGCCCCCG TGGCGAGGCG GCTGGGCGAG 
CTGCTGGGCG CCGAGGTCGC CTTCGCGACC GACGTGGTCG GGGAGTCGGC CCAGGGCGTC 
GTGGACGCCC TCCAGGACGG CCAGGTGGCC CTGCTGGAGA ACCTGCGGTT CGAGCCGGGC 
GAGGAGTCCA AGGACGACGC CCGGCGGGCG GCCTTCGCCG AGAAGCTGGC CGCCCTGGCG 
GAGGTCTACG TCGGTGACGG CTTCGGCGCC GTGCACCGCA AGCACGCCAG TGTCTACGAC 
GTGCCGCTGC TGCTGTCGCA CGCGGCGGGC AGGCTGGTCA CGGCCGAGGT CGAGGTGCTC 
AAGAAGCTGA CCGACGACCT CGCCAGGCCG TACGCCGTGG TGCTGGGCGG AGCCAAGGTC 
TCCGACAAGC TCGGCGTGAT CGGCAACCTG CTCACCAAGG TCGACCGGCT GCTCATCGGC 
GGCGGCATGG CCTACACCTT CCTGGCCGCC CAGGGCTACG AGGTGGGCCA GTCGCTGCTG 
CAGAAGGACC AGCTCGACCA GGTGCGCGGC TTCCTCAACG AGGCGGCCAA GCGCGGCGTG 
GAGCTCGTCC TGCCGGTCGA CGTGCTGGCG GCCACCGAGT TCGCCGAGGA CGCCGAGTAC 
GAGGTGGTCG ACGCCACCGC GATCCCGGCC GATCGGCAGG GGCTCGACAT CGGCCCGCGC 
AGCCGCGAGC TGTTCGCGAG CAAGCTGGCC GACGCCAGGA CCGTGTTCTG GAACGGCCCG 
ATGGGCGTCT TCGAGTTCGA GGCGTTCTCC GGCGGAACCC GGGCCGTCGC CGAGGCGTTG 
GTCCAGTCGG AGGCCTTCAC CGTCGTCGGC GGCGGTGACT CGGCCGCGGC CGTGCGCAAG 
CTCGGCCTCC CCGAGGACGG GTTCTCGCAC ATCTCCACCG GTGGCGGCGC CAGCCTCGAA 
TACCTGGAGG GCAAGACCCT GCCCGGACTC GTCGCGCTGG AGGCATAG

Protein sequence

MKDLSELDVK GRRVLVRADL NVPLDGDVIT DDGRIRASVP TIRELADKGA RVVVCAHLGR 
PKGEPNPKYS LAPVARRLGE LLGAEVAFAT DVVGESAQGV VDALQDGQVA LLENLRFEPG 
EESKDDARRA AFAEKLAALA EVYVGDGFGA VHRKHASVYD VPLLLSHAAG RLVTAEVEVL 
KKLTDDLARP YAVVLGGAKV SDKLGVIGNL LTKVDRLLIG GGMAYTFLAA QGYEVGQSLL 
QKDQLDQVRG FLNEAAKRGV ELVLPVDVLA ATEFAEDAEY EVVDATAIPA DRQGLDIGPR 
SRELFASKLA DARTVFWNGP MGVFEFEAFS GGTRAVAEAL VQSEAFTVVG GGDSAAAVRK 
LGLPEDGFSH ISTGGGASLE YLEGKTLPGL VALEA