Gene Sros_8830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8830
Symbol
ID	8672168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	9748232
End bp	9749956
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	72%
IMG OID
Product	peptide synthetase
Protein accession	YP_003344206
Protein GI	271970010
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.426227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000549729
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCGACG CGCTGATCGC CCGGGTTGAG CGGTGGGCGA GGGAGATCCC GGACGCTCCC 
GCGTACACCT TCCTGGACTA CTCCGCCGGA CACGACGGGG TGAAGCACAC GCTCTCCTGG 
GCGAAGGCGG ATCTCAAGGC GCGGGCGCTG GCCGTACGGC TGCGCGAGGT GACGCTCCCC 
GGTGACCGGG CGGCGATCCT GGCGCCGCAG GGGCTGGAGT ACGTGGTCGC GATGCTCGGG 
ACCATGTACG CCCGGGTGGT CGCGGTGCCG CTGTTCGCAC CCGACCTGCC CGGCCACGCC 
GACCGGCTGA TCCGGGCCTA CGCCGACGCC GACCCGGTCT GCGTGCTCAC CACGACCTCC 
GCGCTGGACA GCGTCCACGC CTTCCTGGAC GGCGGGTCCG CGCCCCGGCC CAAGCAGGTC 
ATCACGCTGG ACGCGGTCTC CGACCTGCTC GCCGACGAGT GGGAGCCCGA GCCGATCGGG 
CTCGGCGACC TGGCCTACCT GCAGTACACC TCCGGCTCGA CCCGCGCCCC CGCGGGAGTG 
GAGATCAGCC ACGCCAACTT CACCGCGAAC GCCGAGCAGC TCTGGGAGGC CTTCCGGGCC 
ACCCCCCGGG TGTCCACGGC GGCCCTGTGG CTGCCGCTCT TCCACGACAT GGGCCTGATC 
GCCACGATCG CCGCGCCGAT GGTGGGCGGA AACCAGGCGG TGTTCATGGA CCCGGTCGCG 
TTCGTCATGC ACCCGGTGCG GTGGCTGCGG ATGCTCAGCG AGTACGACGA CGTGTTCACC 
GGCGGCCCCA ACTTCGCCTT CGAGTACACG GCCGGCCGGG TCACCGACGA GGAGAAGGCC 
ACGCTCGACC TGTCCGGGGT CTCGGTCATG CTCAACGGCG CCGAGCCGCT GCGCGGCAGC 
ACGATCGACC GGTTCTCCGA GACGTTCGCC GCGTGCGGGC TGCGGCCCGA GGCGCACACC 
CCCGGGTACG GCCTGGCGGA GGCGACGGTG TTCGTCACGG TGATGGACCG GGACCTGCCG 
GCCCGGGTGA CCCTGTTCGA CAGGGACGCG CTGACCGCCG GGCGGGCCGT GCCGTACACG 
GGTGAGGGAC GGGTCAGCGA CCTGGTCTCC TGCGGGGTGC CGACGGGCCA GCGGGTCGCC 
ATCGTCTCGG AGTCCGGTAC GGCGAAGCCG GACGGCGAGG TGGGCGAGAT CTGGGTGCAG 
GGGCCGAACG TGGCGCGGGC CTACTGGCGG GACGAGGAGC GCAGCGCCGA GGTCTTCGGC 
AACGTGCTCG ACGGCGCGGA CGGCACCTGG CTGCGGACCG GGGACCTGGG CGTCGTCCAC 
GAGGGCGAGC TCTACATCAC CGGGCGGATC AAGGACCTGA TCATCGTCGA CGGGCGCAAC 
CACTATCCAC AGGATGTGGA GGTGACCGTG CAGGAGGCCG ACCAGGCCGT CCGCCGGGAC 
CACGTGGCGG CGTTCGCCCT GCCGGGGGAG GAGACCGAGC GGCTGGTCGT GGTGGCCGAG 
CGGTCCCGCA GGGCCGCCGG GCGCGACCTC GCCGAGGTCA CGGCCAACAT CCGCGCGGCT 
GTCGCGAAAA ACCATGATCT GCGGCTGCAT GACTTCGTGC TGACCGAGGC GGGAGTCGTG 
CCGCGCACGT CGAGCGGGAA GATCGCCCGC AGGGCGTGCG TACTGGCCTA CCTGGACGGC 
GCGTTCGGCC CCCGGCCCGC CGGGCCCAGG GACGCCGGCG TCTGA

Protein sequence

MSDALIARVE RWAREIPDAP AYTFLDYSAG HDGVKHTLSW AKADLKARAL AVRLREVTLP 
GDRAAILAPQ GLEYVVAMLG TMYARVVAVP LFAPDLPGHA DRLIRAYADA DPVCVLTTTS 
ALDSVHAFLD GGSAPRPKQV ITLDAVSDLL ADEWEPEPIG LGDLAYLQYT SGSTRAPAGV 
EISHANFTAN AEQLWEAFRA TPRVSTAALW LPLFHDMGLI ATIAAPMVGG NQAVFMDPVA 
FVMHPVRWLR MLSEYDDVFT GGPNFAFEYT AGRVTDEEKA TLDLSGVSVM LNGAEPLRGS 
TIDRFSETFA ACGLRPEAHT PGYGLAEATV FVTVMDRDLP ARVTLFDRDA LTAGRAVPYT 
GEGRVSDLVS CGVPTGQRVA IVSESGTAKP DGEVGEIWVQ GPNVARAYWR DEERSAEVFG 
NVLDGADGTW LRTGDLGVVH EGELYITGRI KDLIIVDGRN HYPQDVEVTV QEADQAVRRD 
HVAAFALPGE ETERLVVVAE RSRRAAGRDL AEVTANIRAA VAKNHDLRLH DFVLTEAGVV 
PRTSSGKIAR RACVLAYLDG AFGPRPAGPR DAGV