Gene Sros_5165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5165
Symbol
ID	8668459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5678375
End bp	5680087
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340686
Protein GI	271966490
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0452988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCAAGA TGAGATCTAC TCTCGTGCTG CTGCTGTTGT CGATGGGCGG GGCGGTTCTG 
GCAGCGCCGT TGCCCGCCGT GGCAGCGGCT CCGGCGGCCC AGTCGCGGTT CGCCTGTGAC 
GAGGTGGATG CCAAGGACAA GGGCTGGGTG CTGCCGATCT ATGTCCACCA GCCCGGGCAG 
GACGCCTGGG AGGACGACAG CGCCGCCCTG CTGAACACCA TCTGGGAGAC CGACCAGACG 
GTCGACTCGA GCGCGGAGCG GTTCGGGGGC TCCCGGCGGC TCCGGTTCGT GCAGGACGGT 
GACTGCCGTC CGGTGGTGGC GAAACTGCCG TTCACCAAGG GCCGCAACCG GGCCGAGATG 
GGCAAGGCGA TGGCGGAGAA CCTCGCCTCC CAGCCTGCCC TGGTGCGTAC GCTCTGGCAG 
ACCAACCGGG TCAAGCCGTT GTACTTCGTC AGGGACAACG AGATCACGGA CTCCTGCACG 
GGCGGCGGCG CCAACGCCGG GCTGAGCACC GGCAACGTCA TCCTCCCGCG CTGGTGCTGG 
AGCGAGGCCG GGCTCACCCA CGAGCTGATC CACAGCTTCG GGCTCTCGCA CTGCGACGGG 
GGCGGCGTGA ACGGCAACGA CCCGGTCTGC CGGAACATGG GCACCCGGAA GGAGTGCACG 
AGCGACCTCG CGGCCAACTA CCACCTTGAC TCGTGCCGGA TCGACGAATT CCGCTACTTC 
GAGCCGACGC CGGTACGGCA GCCCGAGCTG GAGAAGATCA GGAACGTCGC GTTCAGCCCG 
TACCTGATCC AGAACCAGCC GAGCCCGGTG TGGCAGTTCC GCATCAAGGT GGTGGACAGC 
GGCAGATGCC TCGACGCAAG CGCGGCGCAG GTCGTGCAGC GCGCGTGTAC GGACAGCTCC 
GCGCAGACGT GGCAGCGCAG CATCGACGAC GACGGCTACC TCACCATCCG CAACGCGGCG 
AACGGCCGCT GCCTCACCAT GGCGGACACC GTCGTGACCG GCCCGTGCGC GAAGAAGGAC 
AAGTCGCAGC AGTGGCTGCC GCAGGCTGGT CAGGACAGGA CCAACTTCGC CGGCCGCGCC 
GGTGGGAAGC TGTCCGTCAA GGACAACCGT GACGGCGGAG CGGTGGTGCG CGACGGCAAG 
GGTGAGTTCG TGACCGAGCT GCTGGGCGGC CTGGCCTCCT CGCCCACCCA GCCGAACACC 
CCGGCCCCGA CGGCCACGTC GCAGCCGACC GCGGAGCCGA CCGCAAGGCC GACCCCCAGG 
CCGACCGCGG CACCGACCTC CGCTCCGGAG GCGGCCGTCA CGCCGGGCCC GGTCGAGTCG 
CTCGACCCCG CCAAAACTCC TGCGCAGGGC CGGAACGTCC AGTTCAAGAG CGCGTACGGC 
ACCTGCCTGA CCGCGTCCGG CACCAGGGTG CGCCTCGGCG CCTGCGACAC CAGGTGGAAC 
GTCGTGACGG TCGGCAAGCA CGTGCAGGTA CGCCACCAGA ACCGATGCAT GGCGCTCGGC 
AAGGTCAGCG GTGGCAAGCG CTCGGTCGTC CTGGCCAAGT GCGGCACGGC CGCCAAGGGG 
CAGCGCTGGT TGCTCGAGAA GGCCGGCGGC TCGGTCACGC TGAAGAGCGC GACCACAAAG 
GCCACCCGGC TCATCGCCTT CACCGCCAAG CCTGCCAGCG TCTACGCCAA AGCCGCGTAC 
CAGAAGAATT CCATCAAATT TATAATCAGA TAA

Protein sequence

MSKMRSTLVL LLLSMGGAVL AAPLPAVAAA PAAQSRFACD EVDAKDKGWV LPIYVHQPGQ 
DAWEDDSAAL LNTIWETDQT VDSSAERFGG SRRLRFVQDG DCRPVVAKLP FTKGRNRAEM 
GKAMAENLAS QPALVRTLWQ TNRVKPLYFV RDNEITDSCT GGGANAGLST GNVILPRWCW 
SEAGLTHELI HSFGLSHCDG GGVNGNDPVC RNMGTRKECT SDLAANYHLD SCRIDEFRYF 
EPTPVRQPEL EKIRNVAFSP YLIQNQPSPV WQFRIKVVDS GRCLDASAAQ VVQRACTDSS 
AQTWQRSIDD DGYLTIRNAA NGRCLTMADT VVTGPCAKKD KSQQWLPQAG QDRTNFAGRA 
GGKLSVKDNR DGGAVVRDGK GEFVTELLGG LASSPTQPNT PAPTATSQPT AEPTARPTPR 
PTAAPTSAPE AAVTPGPVES LDPAKTPAQG RNVQFKSAYG TCLTASGTRV RLGACDTRWN 
VVTVGKHVQV RHQNRCMALG KVSGGKRSVV LAKCGTAAKG QRWLLEKAGG SVTLKSATTK 
ATRLIAFTAK PASVYAKAAY QKNSIKFIIR