Gene Sros_8001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8001
Symbol
ID	8671326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8814893
End bp	8816458
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	76%
IMG OID
Product	hypothetical protein
Protein accession	YP_003343399
Protein GI	271969203
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.212108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAGG TTCTCGACCC GCCCGCGGTC CGGCAGTGGT CGCGGCTGGC CGCGGAGACA 
CTGGGAAAGG CGCGCGAGGA GATCGACGCG CTCAACGTCT TCCCCGTCCC CGACGGCGAC 
ACCGGCACCA ACCTGCACCT GACCATGCTC TCCGCGGCCG AGGCGCTCGA CGGGCTGCCG 
GGCGACGCCG ACGCCGCGAC CACCTGGCAG GCGCTCGCGC AGGGCGCGCT GCTCGGCGCC 
CGGGGCAACT CCGGAGTCAT CGTCAGCCAG GCGCTGCGCG GCCTCGCCGA GGTGCTCAGG 
GCGACCGAGG GGCGGGGCGC CGACCTCGGG CTCGGCCTGG TCAGGGCCGC CGAGCTGGCC 
CGCGCGGCGG TGGCCAGACC GGTCGAGGGC ACGGTGCTCA GCGTGCTCAC CGCGGTCGCC 
GGGGCGGTGC GCGACCTGAC GGGAGACCTC GCCTCGGTGG CCAGGAGGGC GGCCGACGAG 
GCGCGCTCCG CGCTCCGCCG CACTCCGGAC CAGCTCGACG TGCTCGCCCG GAGCGGCGTG 
GTGGACGCGG GCGGTGCGGG CCTGGCGATC ATCCTGGAGA GCCTCGCCGC GGTGATCACC 
GACTCCTACA CCGGGCGGGT CGACATCCCG GCGCCGACCC ACCGGGTCGC CCCGGAGCCG 
GAGGAGGGCC CCGGCTACGA GGTCATGTAC CTGCTCGACG CCGGCGAGGC GGCGGTCGGC 
GCGCTCCGCC GCGAGCTGGA CGCGCTCGGC GACTCCCTGG TGGTCGTGGG CGGCGACGGC 
CTGTGGAACG TGCACGTCCA CGTGGACGAC GCGGGCGCGG CGATCGAGGC GGCCATGCGG 
GCGGGGCGGC CGCACCGGAT CAGGGTGACC TACCTGGTCG GCTCCGGCCG GACCCACCCG 
GCGGCCCGGG GGCGCGGGGT GGTGGCGGTG GCGGCCGGGC CCGCGCTGGG CGCCGTGTTC 
GAGCAGTCGG GAGCCGTGGT GGTCCGCAGG GAGCCCGGCT CCAGCCCGCC CCTGGCGGCG 
GTGCTCGCGG CCATCCGCGA GGCGGGGGCG GAGGTCGTGG TGCTGCCCAA CGACAGCGGG 
ACCCGCGAGG TCGCGGCGGC CGCCGCCGAG ATCGCCCGCG AGGAGGGCCT GATGGTCAGC 
GTGCTGCCCA CCAGAGCCTC GGTGCAGGGC CTGGCGGCGC TGGCGGTCCA CGATCCGCTG 
CGGCGCTTCG ACGACGACGT GGTGGCCATG ACCGAGGCCG CCGCGCACAC CCGGCACGGG 
CACGTCTGGG TGGCCGACCG CGAGGTGATG ACGAGCGCGG GCCTGACCGC GCCGGGAGAC 
GTCCTGGGCG TCATCGACGG CGACGCCGCG GTGATCGGCG CCGACCTCGT GGGCACCGCC 
CTGGAGATCA CCCGTCGCAT GGTGTCGTCG AGCAGCGAGC TGGTGACCAT GCTCGAAGGC 
GTCAACGCGC CGGAGGGGCT GGCCAGGGCC GTGCAGGACC ATCTGGCCCG GATCCGGCCC 
GACGTCGAGG TCGTCCTGTA CGAAGGCGGG CAGGGCGGCT ACCCGCTGCT CATCGGCGTC 
GAGTGA

Protein sequence

MLQVLDPPAV RQWSRLAAET LGKAREEIDA LNVFPVPDGD TGTNLHLTML SAAEALDGLP 
GDADAATTWQ ALAQGALLGA RGNSGVIVSQ ALRGLAEVLR ATEGRGADLG LGLVRAAELA 
RAAVARPVEG TVLSVLTAVA GAVRDLTGDL ASVARRAADE ARSALRRTPD QLDVLARSGV 
VDAGGAGLAI ILESLAAVIT DSYTGRVDIP APTHRVAPEP EEGPGYEVMY LLDAGEAAVG 
ALRRELDALG DSLVVVGGDG LWNVHVHVDD AGAAIEAAMR AGRPHRIRVT YLVGSGRTHP 
AARGRGVVAV AAGPALGAVF EQSGAVVVRR EPGSSPPLAA VLAAIREAGA EVVVLPNDSG 
TREVAAAAAE IAREEGLMVS VLPTRASVQG LAALAVHDPL RRFDDDVVAM TEAAAHTRHG 
HVWVADREVM TSAGLTAPGD VLGVIDGDAA VIGADLVGTA LEITRRMVSS SSELVTMLEG 
VNAPEGLARA VQDHLARIRP DVEVVLYEGG QGGYPLLIGV E