Gene Sros_5100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5100
Symbol
ID	8668394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5615118
End bp	5616224
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	69%
IMG OID
Product	putative hydrolase
Protein accession	YP_003340628
Protein GI	271966432
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0429658
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAATC CGTTCCGCAT CGACATCCCC CAGGCCGACC TCGACGACCT GACCGACCGG 
CTCTCCCGCA CCCGCTGGCC CAACGAGGTC GCCGACGCCG GATGGGACTA CGGCTTCCCG 
CTCGCGCGGC TCAAGGAACT GGCCGAATAC TGGCGCACCG GCTACGACTG GCGCGAGCAC 
GAGGCCAAGC TCAACGAGCT CCCGCACTTC ACCACCGAGA TCGACGGCCA GAACATCCAC 
TTCGTCCACG TCCGGTCTTC GAACCCGGAC GCGCTCGCGC TGATCCTCAC CCACGGCTGG 
CCCGGTTCGT TCCTGGAGTT CCTCGATGTG ATCGAGCCGC TGTCGCGCGA CTTCCACCTG 
GTGATTCCGT CCATCCCGGG TTTCGGCTTC TCCGGGCCGA CCCACGAGCG CGGCTGGGAC 
ATCGTCCGGG TCGCGCGGGC CTGGGCTGAG CTGATGCGCC GTCTCGGGTA CGAGCGCTAT 
GGCGCGCAGG GTGGCGACTT CGGCTCGGGC ATCTCGATGG CGCTCGGCGC GGTGGCACCC 
GAGCAGGTCG TCGGGGTGCA CGTCAACTAC CTGCCGACCC GGCCGGTCCC GGACGCCGAC 
ATCGAACTGT CCGAAACGGA TGAAGCCCGG CTGGACAAGG TCAGGCAGCT GATGGCGAAC 
CGTCCTCCGT ACCAGGCTCT GCAGGCCAGC ACCCCGCAGA CCATCGGTTA CGCGCTGACC 
GACTCGCCGG TCGGCCAGCT GGCCTGGATC GCCGAGCGCT TCGCACAGTG GACGGACCCT 
CGCTCGCCGA TCAGTGACGA GCGGATGCTC ACCGACATCT CGCTGTACTG GCTGACCGCC 
ACCGCGGCTT CCTCGGCGCG GCTGTCCCGA GAGGCTCCGC GGCGGATCGA GCCGTGCCCG 
GTACCGGTCG GCGTGGCGGT GTTCGCGCAC GACATCACGC AGTCGGTGCG ACCGCTGGCC 
GAGCGGCTGT ACGACATCAG GCACTGGTCG GAGTTCGAGC GCGGCGGCCA CTTCGCCGCG 
ATGGAGGTGC CCGAGCTGCT CGCCGAGGAC GTCCGGGACT TCTTCCGTAC CCACATCAAG 
GACGACGACC GGGTCACCAC CCGCTAG

Protein sequence

MINPFRIDIP QADLDDLTDR LSRTRWPNEV ADAGWDYGFP LARLKELAEY WRTGYDWREH 
EAKLNELPHF TTEIDGQNIH FVHVRSSNPD ALALILTHGW PGSFLEFLDV IEPLSRDFHL 
VIPSIPGFGF SGPTHERGWD IVRVARAWAE LMRRLGYERY GAQGGDFGSG ISMALGAVAP 
EQVVGVHVNY LPTRPVPDAD IELSETDEAR LDKVRQLMAN RPPYQALQAS TPQTIGYALT 
DSPVGQLAWI AERFAQWTDP RSPISDERML TDISLYWLTA TAASSARLSR EAPRRIEPCP 
VPVGVAVFAH DITQSVRPLA ERLYDIRHWS EFERGGHFAA MEVPELLAED VRDFFRTHIK 
DDDRVTTR