Gene Sros_8893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8893
Symbol
ID	8672231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9820607
End bp	9821815
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003344268
Protein GI	271970072
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGGA CCTCCCTCCG GTGGCACGCA CAAGGAGCGC CCGCCCGCGC CGCGTGGCGG 
GCTTGGGCGC GTGGGGACAT CGACGACGCC GAGCGCCTGG CCGCGCATGC CGGTCACCGG 
CAGCACGCGC ACCTCCGGTT CCTGACCAGC TACGTGCGCG GAAACTACGA GCAGGCGCTG 
ACCCACTACG AGGCCATTCG CCGCCTGTAT CCGGCCTACA CGGAACTGGA TGAACCCGCC 
GCGCATGCTC TGCTGCATCT GGACCGGCCG GCTGAGGCCT ACGCGCACGT ACAGCGGCGC 
CGGAGGAAAC GACCGCTGCC CCCCGACCTC GTGTCGCGGA TGGATCACCC GCTGGGCGTC 
GAGATCGACC ACGCGACCGT CCTTCCCTTC GCCGATCACG CGCTGGCGCC CTACCTGCCC 
GCCGTGGACG CCACGCTCGA CGGCCACCCT GTGCGCACCC ACATCGACAC CGGCGGCACG 
TTCCTCGTCA TGGGAACCAG GCGCGCCGAC GCACTGGGCA TCCGGCTGAT CTCCAGCGGA 
AAGAATCATC ACGGTACGAC CCGCACCGAC CTCTACACCG GGATGGCCAG GGAACTGACG 
CTCGGCGACG TCGTCTTGAC CAACGTGCCG GTGGAGGCCA TGCCGACGCT ACGCGACGAC 
CAGGACCTCG TCATCATCGG CACCAACGTC CTGCAGCGGT TTCTCACCAC CGTCGACTAC 
CCCCGCCGGC GCCTGCTCCT GTCACGACGC CGCGACCCAC GGCAGGCGGC CGACCATCTT 
GCGCTTCTCG ACGGCCGGCC GGAGGTCGCC CGGGTCCCCT TCTACCTGTG GGCAGACCAC 
TACATGTTCG CCCGTGGAGG CTTCGGCACC CGGCAGGACC TCAACTTTTT CATCGACTCC 
GGACTGGTCT ACGTCGGCCA GGAGGACGGC TCACCGCCCC GCCAGGCATG CCTGTACACG 
ACCGCGCGGC GATACCGCTC CTGGGGTGTG CACCGGGCTC GCGCGGCCCG CCCGCACTTC 
AGCGTCGACG AACCGATCCG CCTGGGACCG CTCCGTCAGG ACGACCAGTT CGTGGCCACG 
ACGCCGGCCC GGCGTGTGCC CTGGGCGTCG TTCGGGGGCG TTCGCATCGA CGGCCTGCTT 
TCCCACTCCT TCCTCGACAA GTACGCCTGG ACCCTCGACT TCGACCGGCA CGAATACACA 
TTCCGATGA

Protein sequence

MSWTSLRWHA QGAPARAAWR AWARGDIDDA ERLAAHAGHR QHAHLRFLTS YVRGNYEQAL 
THYEAIRRLY PAYTELDEPA AHALLHLDRP AEAYAHVQRR RRKRPLPPDL VSRMDHPLGV 
EIDHATVLPF ADHALAPYLP AVDATLDGHP VRTHIDTGGT FLVMGTRRAD ALGIRLISSG 
KNHHGTTRTD LYTGMARELT LGDVVLTNVP VEAMPTLRDD QDLVIIGTNV LQRFLTTVDY 
PRRRLLLSRR RDPRQAADHL ALLDGRPEVA RVPFYLWADH YMFARGGFGT RQDLNFFIDS 
GLVYVGQEDG SPPRQACLYT TARRYRSWGV HRARAARPHF SVDEPIRLGP LRQDDQFVAT 
TPARRVPWAS FGGVRIDGLL SHSFLDKYAW TLDFDRHEYT FR