Gene Sros_5389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5389
Symbol
ID	8668683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5906565
End bp	5908154
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	75%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340894
Protein GI	271966698
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.539443
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCC TGACGGGAAC CGGCGTACTC GCCCGGCTCG TCGTCCGCCG CGACCGCCTC 
ATCCTCCCCC TGTGGGGCCT GCCCGCCGCG CTCTACCCGT CGAGCATCGC CGGCAGCACC 
GCCGGGCTCT ACCCGACCGC CGAGGCCCTG CGCGGCGTGG GCGACGCGGC GATGGCCAAC 
CCCTCGCAGG CGGCCATGCG CGGCCCGGTG TTCGAGGCGA GCGTGGGCGG GCTGACCGCA 
CACACCGTGA CCAGTTCGGG TGGCATGCTG CTCGGGCTGG TGAGCATGCT CCTGATGATC 
CGGCACAGCA GGGGCGAGGA GGAATCGGGC CGCCGCGAAC TCGCCGCCGC GGGAGTGGTG 
GGCAGGCACG CGCCGTTGAC CGCGGCGCTG GCCGTGGTGC TCGCCGCCAA CCTGGTGATC 
GCCGTCCTCA TGGCGGGCGC GCTCACCGGC GTGGGGCTGC CCGCCTCCGG CTCCTTCGCG 
CTGGCCCTGT CGCTGGCCGC CGCCGGATGG ACCTTCGCCG CGGTCGGCGC CCTCGCCGCG 
CAGCTCACGG AGAGCGTGGC CGCGGCCAGG GGGATAGGCA TCGGGGTGTT CGCCGTCTTC 
TTCCTGATCC GAGCGGTCGG CGACGCGGGC GGGGTGGCCT GGCTGTCGTG GGCGTCGCCG 
CTGGGCTGGA CGCTGCGGGT ACGGCCGTTC GCGGGCGAGC GCTGGTGGGT CTTCGCGCTC 
CTGCTGGCCC TGGTCGTCGC GCTGGCAGGC ACGGCCTACC GGCTGTCGTC CCGCCGCGAC 
CTGGCCGCCG GTGTGCTGCC TGCACGGCTC GGGCCCGTAG CGGCGGCGCC CGGGCTGCGC 
AGCGCGCCGG CCCTGGCCTG GCGGCTGCAC CGCGGTCAGC TGGTGGCCTG GATCGCCGGG 
TTCGCGGCGG GCGGCCTCGC GCTCGGCGGT GCCGTCTCCG GCGGGATCGA AGGCCAGATC 
GACGCTCCGC AGATCATGGA GATGATCGCC AGGGTGGGGG GCGGGGACGC CGAGCCGGCC 
GACTTCTTCG TCAACTACCT GCTGTCCATG CTCGCCTGGA TCATCGCCGC CTACGGCATC 
CTGTCCGCGC TCCGGCTGCG GACGGAGGAG ACGGCGGGGC GCGCCGACCT GGTGCTGGTG 
ACCCCGACGA GCCGCATCCG GTGGGCGCTC AGCCATCTGT TCATGGCGGT GGTCGCGCCC 
GCGGCGGCAA TGGTGGCGCT GGGCGCGGCC ACCGGACTCG CCTACAGCGC GCGCGGCGGC 
GACCCGGGCA AGTTCCCGCT GGTGCTGGGG GCCGCGCTGG CCTACCTGCC CGCCGTCTGG 
GTGATGACGG GGATCGCGGT CGTCCTGGCC GGGCTGCTGC CCCGGCTGTC CACGGCCGCG 
TGGGGGATCT GGGTGGCGTT CATCCTGCTC GACGTGCTCG GCACTCTGGG GCAGGTCGAC 
GAGTCGGTGC TGAACATCAT CCCGTTCGTG CACGTGCCGT GGATCATCCT CGGCCAGACG 
GCAGTGGCAC CGCTGCTCCT AATGACCGTG GTCGCCGTCG CCCTGGGCGC CACCGGGCTG 
GCCGGTCTGC GCCGCCGCGA CATCGCGTGA

Protein sequence

MSALTGTGVL ARLVVRRDRL ILPLWGLPAA LYPSSIAGST AGLYPTAEAL RGVGDAAMAN 
PSQAAMRGPV FEASVGGLTA HTVTSSGGML LGLVSMLLMI RHSRGEEESG RRELAAAGVV 
GRHAPLTAAL AVVLAANLVI AVLMAGALTG VGLPASGSFA LALSLAAAGW TFAAVGALAA 
QLTESVAAAR GIGIGVFAVF FLIRAVGDAG GVAWLSWASP LGWTLRVRPF AGERWWVFAL 
LLALVVALAG TAYRLSSRRD LAAGVLPARL GPVAAAPGLR SAPALAWRLH RGQLVAWIAG 
FAAGGLALGG AVSGGIEGQI DAPQIMEMIA RVGGGDAEPA DFFVNYLLSM LAWIIAAYGI 
LSALRLRTEE TAGRADLVLV TPTSRIRWAL SHLFMAVVAP AAAMVALGAA TGLAYSARGG 
DPGKFPLVLG AALAYLPAVW VMTGIAVVLA GLLPRLSTAA WGIWVAFILL DVLGTLGQVD 
ESVLNIIPFV HVPWIILGQT AVAPLLLMTV VAVALGATGL AGLRRRDIA