Gene Sros_3348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3348
Symbol
ID	8666636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3673994
End bp	3675586
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	74%
IMG OID
Product	non-ribosomal peptide synthetase
Protein accession	YP_003339030
Protein GI	271964834
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00415757
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGACCGCCC CGACCACCGA GACGGAGCTC GGCGCCCTGT GGCGCCAGGT GCTCCGCGTG 
CCCGCCGTCG CCCCCGGCGA CAACTTCTTC GAGCTGGGCG GCGACTCCTT CCGGGCCGCC 
CAGCTCGCCG GCCTGGTCGG CACCCGCCTG GGGGTGCCCG TCACGCCGGC CCTCGCCTTC 
GACCGGCCGG AGCTGGCCGG GCAGGCCCGC TGGATCGACG ACGCCCGCGC CGCGGGGCTC 
TCGGCCGCCG CCGGGCCCGC GACCGGCGGG GGAGCTCCGC TCAGCACCCA GCAGGAGGAC 
TTCCTGTACT GGATGTTCGA GAGCGAGCCC GTCCGCGACA TCGGGTCCTG CGCCACCGCG 
ATCCGGATCC GCGACTCCTT CGACGTGGCC GTCCTCACCC GCGCGCTGGA GGCGGTGATC 
GCGCGGCACG AGCCGCTGCG CAGCGTCGTC ACCGCGTCGG GGGAGGTGAT CGTCGCTGAC 
GAGCTGCCGC CCGAGGTCGC CGAGGCCGTG GCCGAGGGCC GGACGCCGCA GGAGCGCGAG 
CGCGACGCCG AGCGGATCGT CTGGCACGAG CGCATGCGTC TCGACGACGT TCTGCGCGGC 
CCCCTCGTGC GGGCCCTCGT CGTGCACCTC GGCGAGGACG ACCACGTGCT GGTCCTCGCC 
GTGCACCACT TCGCCTTCGA CGGCTTCTCC CTGGGCGTCA TGCTCCGCGA GCTGGGCATC 
GTCTACTCGG CCCTGCGTAC GGGCTACCCC AGCCCGCTGC GCCCGCTGCC GATGTCCTAC 
GCCGACTACT GCGCCTTCAC CCGCGAGCAG TGGCCGCGCA ACCAGGCGTA CTGGGACCTG 
GTCCTGGAGG GTGCCCCCCG CGAACTGACG CCGTTCCCCG GCCGCAGGGA GACCACCCTG 
TTCTCCCGCC GCAGGCACGC CTTCGAGATC GACGCGGAGC TGGCCGGCCG GCTGGGGGAG 
ACCGCCAGGG CGCGCGGCGC GACCACGTTC ATGGCGGTGG CCGCGTGCTG GACCTGGCTG 
CTGCGCCAGT GGACGGGGAT GACCGACCTG GTGGTGATGT CGCCCGTGCC CGGCCGTACC 
GCGCCCGAGC ACGAGACGCT GATCGGCTGC CTGGTCCAGT CGCTCATCCT GCGCCTGGAC 
GCCTCGGGCG ACCCCTCCTA CGGCGAGCTG GTCGACCGGG TCCGGGAGGT GTCCGTGGGG 
GCGGTGGCGC ACCAGTTCCA CGCCTACCAG GACGCCCGGC TCCGGGTGCC CTTCCCCTCG 
CGGATCCACT ACGAGAGCTT CGGCGCCCCG CACTTCCCCG GCCTCATGTC CGAGGCCTTC 
CCCTTCCCCC GGGAGCAGGA GGGGCTGGAC TGGAGCGCCA ACCCGGGCGA GGTCGACCTC 
AGCGCCCCGG AGCTGATCGT CGAGGAGCAG CGGGACGGCT CCATGCTGGC CGCCGTGGTC 
TACAACCACT ACGGTTACGA CCCCGCGACG GCCGCCGAGC TCGCCGAGTC CTTCCAGGAG 
TACGTCAGGG CCGCCGTGGC CGTTCCTGAC TCCCCGCTGC CGCCGCTGCC CGCGACAGCC 
AGCCACGCCG GGGCGGAGGC CAGCCAGGGC TGA

Protein sequence

MTAPTTETEL GALWRQVLRV PAVAPGDNFF ELGGDSFRAA QLAGLVGTRL GVPVTPALAF 
DRPELAGQAR WIDDARAAGL SAAAGPATGG GAPLSTQQED FLYWMFESEP VRDIGSCATA 
IRIRDSFDVA VLTRALEAVI ARHEPLRSVV TASGEVIVAD ELPPEVAEAV AEGRTPQERE 
RDAERIVWHE RMRLDDVLRG PLVRALVVHL GEDDHVLVLA VHHFAFDGFS LGVMLRELGI 
VYSALRTGYP SPLRPLPMSY ADYCAFTREQ WPRNQAYWDL VLEGAPRELT PFPGRRETTL 
FSRRRHAFEI DAELAGRLGE TARARGATTF MAVAACWTWL LRQWTGMTDL VVMSPVPGRT 
APEHETLIGC LVQSLILRLD ASGDPSYGEL VDRVREVSVG AVAHQFHAYQ DARLRVPFPS 
RIHYESFGAP HFPGLMSEAF PFPREQEGLD WSANPGEVDL SAPELIVEEQ RDGSMLAAVV 
YNHYGYDPAT AAELAESFQE YVRAAVAVPD SPLPPLPATA SHAGAEASQG