Gene Sros_2387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2387
Symbol
ID	8665670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2580916
End bp	2582034
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	73%
IMG OID
Product	galactokinase
Protein accession	YP_003338110
Protein GI	271963914
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTTA TTGAAGCTTT TCGTGAGTCG TTCGGCGTGG AGCCCGAGGG GGTGTGGCAC 
GCTCCGGGGC GGGTCAACCT CATCGGCGAG CACACCGACT ACAACGACGG GTTCGTGCTG 
CCGTTCGCGG TGCCGTGGGG AGTCACCGCG GCGGTCGCGC CGCGCGAGGA CGACGTCGTC 
CGGCTGCGGT CGCTCCAGGC GGGCGAGCCG CAGACCGTCG AGACCCTCGG CCGGGCCGAG 
GGCTGGGCGC GCTACGCCGT CGGCGTGTTC TGGGCGCTCC GCGAGGCGGG CCACCCGGTC 
AGGGGCGCGG ATCTGGTGAT CGACGGAGAC GTGCCGCAGG GGGCAGGGCT GTCGTCGAGC 
GCGGCGCTGG AGGTGGTGGT CGGGACCGCG CTCAACGACC TGTACGGCCT GGGCCTCACC 
AAGATGGAGA TCGCCCTCGC CGCGCAGCGG GCCGAGAACG ACTTCGTGGG CATGCCGTGC 
GGGATCATGG ACCAGGCCGC CTCGGCCCTC GGGGAGGAGG GGAAGGCCCT GTTCATGGAC 
TGCCGGAGCC TCGGCACCAG GACCATCCCG TTCGATCTGG CCCAGCACGG CCTCCAACTG 
CTGATCATCA ACACCGGGGT CCACCACGAG CTCGCCGACG GGCAGTACGC CCGGCGCCGT 
CAGGACTGCG AGAACGCCGC CAAGCACCTG GGAGTGGACG CGCTGCGCGA CGTCACCGAC 
CTGGCGGGCG CCCTCGGCAG GCTCAGCGGC GACGAGCGCA GGCGCACCCA GCACGTGGTG 
ACCGAGAACC ACCGGGTCGA GGCGTTGATC GGACTGCTGC GGGCCGGAGC CGTGCGGGAG 
ATCGGGGCCC TGCTGAACGC CTCCCACCTG TCGCTGCGCG ACCAGTACGA GGTGTCCTGC 
GCCGAGCTGG ACGTGGCCGT GGAGTCGGCG GTCCGGGGCG GGGCCAGGGG GGCGCGGATG 
ACCGGTGGCG GGTTCGGCGG GTCGGCGATC GCGCTGGTGG CCGACGACCG GGTGGAGGCC 
GTACGGGAGT CGGTGACCCG GGCGTACGGC GAGCGCGGCT GGGCGGCGCC GGAGATCTAC 
CCCGCCACTC CGGCAGCCGG GGCCCGCCGG CTCCGCTGA

Protein sequence

MRVIEAFRES FGVEPEGVWH APGRVNLIGE HTDYNDGFVL PFAVPWGVTA AVAPREDDVV 
RLRSLQAGEP QTVETLGRAE GWARYAVGVF WALREAGHPV RGADLVIDGD VPQGAGLSSS 
AALEVVVGTA LNDLYGLGLT KMEIALAAQR AENDFVGMPC GIMDQAASAL GEEGKALFMD 
CRSLGTRTIP FDLAQHGLQL LIINTGVHHE LADGQYARRR QDCENAAKHL GVDALRDVTD 
LAGALGRLSG DERRRTQHVV TENHRVEALI GLLRAGAVRE IGALLNASHL SLRDQYEVSC 
AELDVAVESA VRGGARGARM TGGGFGGSAI ALVADDRVEA VRESVTRAYG ERGWAAPEIY 
PATPAAGARR LR