Gene Sros_1214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1214
Symbol
ID	8664489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1245434
End bp	1246564
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID
Product	putative hydrolase
Protein accession	YP_003336955
Protein GI	271962759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.260991
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTCA TGAACGTTGA CATCACCCCG TTCCGCATCG AGATCCCGCA AGCCGACCTT 
GACGATCTGC GGGAGCGGCT GCGCCGTACC CGCTGGAGCG GGGAGATCGG CGGGCAGGGC 
TGGAGCCGCG GAGTGCCCGT CGACTACCTC AGGCAGCTCG CCGACTACTG GGCTGACGGC 
TACGACTGGC GCAAGCAGGA GGCCAGGCTG AACGACCTGC CCCAGTTCAC CACTGAGATC 
GACGGGCAGC GCCTGCACTT CGCGCACGTC CGCTCGGCCA ACCCCGACGC CGTCCCGTTG 
CTGCTCACCC ATGACTGGCC GGGCTCGTTC GTCCTGTTCC TCCAGGCTGT CGAGCCGCTC 
TCGCGGGACT TTCACCTGGT CCTGACCACC CTGCCCGGCA TCGCCTTCTC CGGGCCGCTG 
GCTGGGCCGG GCTGGAACAC CGGCAAGATC GCGGGCGCGT TCGTCGAGTT GATGGGGCGC 
CTCGGCTACG ACCGCTATGG CGTTCAGGGG TCCGGCGGCG GCGCTGCGGT CGCCATCGAG 
ATGGGCCGCC AGGCACCGGA GCAGGTGATC GGCGTCCACG GCAACGGTCA CATCACCTTC 
CCCTCGGACG ACCCGGCCGA CTTCGCCGAC CTGACCGAGG CCGAGCAGCA GCGCCTGGCC 
AGGCTGCAGA ACTTCCGCGA CGACAAGATG GGTTTCAACG TCATCTCCGC CACCAGGCCG 
CAGACCCTGG CCTACGGCCT GCACGACTCC CCGGTCGGCC AGCTGGCCTG GATCACCGAG 
AAGTTCAAGG AGTGGACCGA CGACTCGGCC GATCTGCCCG AGGACGCGGT CGACCGGGAC 
ATCCTGCTGA CCAATGTCAG CCTGTACTGG TTCACCGGCA CCGCGGGCTC GTCCGCCAAC 
CTGTACTACG AGGCGTCCCA CGACCCCGAC GCCTGGACGC CCAAGCCACG CAGCGGCGTT 
CCGACCGGCT TCACGGTGGC CATGAGCACC GACGTGACCA TCCGCCGCTT CGCCGAACGC 
GACAGCGACG TGGTCCACTG GAGCGAACTC GAACGCGGCG GCAACTTCCT CGCCCTCGAA 
CAGCCGGCCG CCTACGCCGC GGATGTCAAG AAGTTCTTCG ACAGCCTCTG A

Protein sequence

MNVMNVDITP FRIEIPQADL DDLRERLRRT RWSGEIGGQG WSRGVPVDYL RQLADYWADG 
YDWRKQEARL NDLPQFTTEI DGQRLHFAHV RSANPDAVPL LLTHDWPGSF VLFLQAVEPL 
SRDFHLVLTT LPGIAFSGPL AGPGWNTGKI AGAFVELMGR LGYDRYGVQG SGGGAAVAIE 
MGRQAPEQVI GVHGNGHITF PSDDPADFAD LTEAEQQRLA RLQNFRDDKM GFNVISATRP 
QTLAYGLHDS PVGQLAWITE KFKEWTDDSA DLPEDAVDRD ILLTNVSLYW FTGTAGSSAN 
LYYEASHDPD AWTPKPRSGV PTGFTVAMST DVTIRRFAER DSDVVHWSEL ERGGNFLALE 
QPAAYAADVK KFFDSL