Gene Sros_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2018
Symbol
ID	8665300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2170461
End bp	2171771
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003337749
Protein GI	271963553
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.571015
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.258757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCCGAT TCCCCCTGCT GGCCGCGGCG GCCGTGGCCA CCGCCTGCGC GACCGCCCTC 
GCCGCCGCGC CCGCGCTGGC CGCCCCCTCC CCCTCCCCTG CCTCCACGCA GACCGCCACC 
ACGCGGGCCA CTCCGGCAGG TCCGACCAGG CCGGTCGAGG TCTTCGCCGA GGACGGCACC 
ATCGCCCGCG CCGAGGTGCC CGCCTCCGCC GGGCCGAGGG CCCGCTCCCT CGCCACCGCC 
GCCGCGAGGC TCACCCCCGT CGAGGTCAAC GGGCCGAGCG CGGACCGGAT CGACCTGGTC 
TTCGTCGGCG ACGGCTACAC CGAGGCAGAA CTCGGCCTCT ACGCCGACCA GGTCGCCGCC 
AAGTGGGCGC TGCTGGCCAA CCGGGAGCCC TTCAAGAGCT ACCGCGGGCT GTTCAACGTC 
TGGCGGGTCG ACATCCCCTC GCCCGTGTCC GGCGTGAGCG GCGACCCCGC GCGCGACGTG 
GTCAGGGACA CCCCGCTCGG GATGACCTTC TGGTGCGACG GCCTGGAGCG GCTGCTCTGC 
GTGGACGAGG ACCGCGCGAA GGCCTACGCG GCGCTGGCGC CCGGCGTGGA CCAGATCGCG 
GCGATGGCCA ACTCCGCCAA GTACGGCGGC GCGGGCTACA CCGACGAGGA GATGGCGACC 
TTCTCCGGCG GCAACGAACG CGCCGGAGAG GTGCTGCCGC ACGAGCTCGG CCACTCCCTG 
GGCGACCTGG CCGACGAGTA CGACTACTAC GCCTACCCGG GTGACGGCAG CCGCTACGAC 
GGCCCCGAGT TCTCGGAGGT CAACGTCAGC GTCCGCGACG CCGGGCGGAT GCGGGCCGAG 
CGGGCCAAGT GGTGGTACTG GCTCGGCGCG CCCAGCCCCG ACGGCGACGT CGTCGGCGCC 
TACGAGGGCG GGTACTACAC CCAGTACGGC GTCTACCGGC CCACCCCCAA CTCGCTGATG 
AAGTCGCTCG GCCGCGAGTT CAACTCGGTC GGCAGGGAGA AGATGATCCA GTCGTTCTAC 
GCGATCGCCC GCCCGATCGA CTCCCACACG CCCAACGAGC GGCCGGTGGC GCGCAGGTCG 
ACGCTCTCGG TGACCCTCGC CCCGGTCCCG ACGCTGTCGG TCCGCTGGTA CCGCGACGGC 
AGGGAGCACC GGCCCTGGCG GGGCCGTACC TCGGTGGACG TCATCGGCAT GGGCAACGGC 
GGCACCGTCA CCGCGGTCGT CACCGACGAG ACCGCCGACG TCCGCGACCC CGGCTACCGG 
GAAGAGTTCC TGACACAGTC CGTCACCTGG ACCGTCCGCG GCAACCACTG A

Protein sequence

MRRFPLLAAA AVATACATAL AAAPALAAPS PSPASTQTAT TRATPAGPTR PVEVFAEDGT 
IARAEVPASA GPRARSLATA AARLTPVEVN GPSADRIDLV FVGDGYTEAE LGLYADQVAA 
KWALLANREP FKSYRGLFNV WRVDIPSPVS GVSGDPARDV VRDTPLGMTF WCDGLERLLC 
VDEDRAKAYA ALAPGVDQIA AMANSAKYGG AGYTDEEMAT FSGGNERAGE VLPHELGHSL 
GDLADEYDYY AYPGDGSRYD GPEFSEVNVS VRDAGRMRAE RAKWWYWLGA PSPDGDVVGA 
YEGGYYTQYG VYRPTPNSLM KSLGREFNSV GREKMIQSFY AIARPIDSHT PNERPVARRS 
TLSVTLAPVP TLSVRWYRDG REHRPWRGRT SVDVIGMGNG GTVTAVVTDE TADVRDPGYR 
EEFLTQSVTW TVRGNH