Gene Sros_6008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6008
Symbol
ID	8669302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6582877
End bp	6584016
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	74%
IMG OID
Product	SoxB2
Protein accession	YP_003341485
Protein GI	271967289
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00127478
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.130354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACG TCGTGGTGAT CGGCGCCGGA GTCGTCGGGG CCGCGTGCGC GTACTACGCG 
GCGCGTGCCG GGCTGGACGT GGTCGTCGTC GACCGCGGGC CCGTGGCGGG CGGCACGACC 
GGCGCGGGAG AGGGAAACGT CCTGGTCTCC GACAAGGAGC CGGGTCCCGA GCTCGACCTC 
GCCCTGCTCT CCAACGGCCT CTGGCGCGAG CTGGCGGAGC TCGACGGCTT CGAGTTCGAG 
GCCAAGGGCG GCCTGGTGGT CGCCGAGACC GGCGAGGTGC TGGAGGCGCT CACCGGCCTG 
GCGGGCAAGC AGGGGGTCGA GCACACGGTG GTCGCCTCCG GCGGGCTCAA CGACTACGAG 
CCCCACCTGG CAGGTGGCTT CGCCGGAGGC GTGTTCTACC CGCAGGACGC CCAGGTCCAG 
CCCATGCTGG CGGCGGCCAG GCTGATCCGG CGGGGCGCCG ACAGCTTCGG CCGCGGCGCC 
CTGATGCTGC GCACCGGTGT CACGGTCACC GGCTTCCTGC GCGACGGCGA CCGGATCGGC 
GGCGTCACGA CCGACCACGG CGACATCCTC GCCGGAGCCG TCGTCAACGC CGCCGGGACC 
TGGGGCGGCG AGGTGGCCGC CATGGCCGGC GTGCACGTCC CGATCCTGCC CCGGCGCGGC 
TTCATCCTGG TCACCGAGCC GTTCGACAGG CCGCTGATCA GGCACAAGGT CTACACCGCC 
GCCTATGTCA CCAACGTGGC CAGCGACTCG GAGGGCCTGG AGACGTCCGC CGTCGTGGAG 
GGCACCCCCT CGGGGCCGGT GCTCATCGGC GCCAGCCGCG AGCGCGTCGG CTTCGACCGC 
ACGGTCTCCG TACCGGTGCT GGAACGCCTC GCCCGCCAGG CCGTGGAGCT GTTCCCGGCG 
CTGGCCGACC GCAGGGCGAT CCGGGCCTAC TGCGGCTTCC GGCCCTACTG CCCCGACCAC 
CTGCCGGTGA TCGGTGAGGA CCCCCGGGCC CCCGGCCTCC ACCACGCCTG CGGCCACGAG 
GGGGCGGGCA TCGGCCTGGC CCCCGCCACC GGCCACCTGA TCGCCCAGTC GCTGGCCGGT 
CTCCGCCCCG ACCTCGACCT CACGCCCTTC CGCCCGGACC GCTTCGAGGA GCGCCGATGA

Protein sequence

MPDVVVIGAG VVGAACAYYA ARAGLDVVVV DRGPVAGGTT GAGEGNVLVS DKEPGPELDL 
ALLSNGLWRE LAELDGFEFE AKGGLVVAET GEVLEALTGL AGKQGVEHTV VASGGLNDYE 
PHLAGGFAGG VFYPQDAQVQ PMLAAARLIR RGADSFGRGA LMLRTGVTVT GFLRDGDRIG 
GVTTDHGDIL AGAVVNAAGT WGGEVAAMAG VHVPILPRRG FILVTEPFDR PLIRHKVYTA 
AYVTNVASDS EGLETSAVVE GTPSGPVLIG ASRERVGFDR TVSVPVLERL ARQAVELFPA 
LADRRAIRAY CGFRPYCPDH LPVIGEDPRA PGLHHACGHE GAGIGLAPAT GHLIAQSLAG 
LRPDLDLTPF RPDRFEERR