Gene Sros_6472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6472
Symbol
ID	8669781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	7091207
End bp	7093564
Gene Length	2358 bp
Protein Length	785 aa
Translation table	11
GC content	76%
IMG OID
Product	hypothetical protein
Protein accession	YP_003341929
Protein GI	271967733
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0255501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.174721
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCT CCGTGCTGGG GGTCCGGCAC CACGGGCCGG GATCGGCGCG CTCCCTCGGA 
GACGAGCTGG AACGCCTCAA GCCTGACATC GTGCTCATCG AGGGCCCGCC CGAGGCCGAC 
GGGCTGGTCG AGCTGGCCAA GGACCCCGGT CTCGAACCCC CGGTGGCGCT GCTGGCCCAC 
GTGCCGGGGG AGCCGTCCAA GGCCGCCTTC TGGCCGTTCG CGGTCTTCTC GCCCGAGTGG 
CAGGCGATCC GCCACGCGGT GGAGGCGGGC ATCCCGGTCC GGTTCTGCGA CCTGCCCGCC 
GCCCACAGCC TCGCCTCCGG GCCGGAGGAG CCGGCCGCCC GGCCGGACAC GCCGGACACG 
CCGGACGGAG AGGGTCCGGA CTCCGGGATA CCGGCGGCCG TACGGACCGA TCCGATCGGG 
ACGCTCGCCC GCGCCGCCGG ATACGACGAT CCGGAGCGCT GGTGGGAGGA CGTGGTCGAG 
CACCGCGGGG ACACGCCGTT CCAGGTGATC GCCGAGGCGA TGGCGGCGGT CCGCGAGGGC 
CACGTGGCCG ACGCCTACGA GGCCCGGCGT GAGGCCTTCA TGCGGCGCAC CATCCGCAGG 
GCGGTCAAGG ACGGGTTCGA GCGGATCGCC GTCGTCTGCG GCGCATGGCA CGTGCCCGCG 
CTGGCCGGGC CGTCGCGGGA GGGCGCGGCC TGGGGGGCCG GGCTGCCCAC GGTGAAGGCC 
GACGACGCGC TGCTGCGCGG GCTGCCCAAG GTCAAGGCCG AGATGACCTG GGTGCCGTGG 
ACGTACGGGC GGCTGGCCGC CTGGAGCGGA TACGGCGCGG GGGTGACGTC ACCCGGCTGG 
TATCACCACC TGTTCACCGC CGCCGACCGT CCGGTGGAGC GGTGGCTGAC CGCCGCCGCG 
GGGGTGCTGC GCGAGGAGGA CCTGCCGGTC TCCTCGGCGC ACGTCATCGA GGCGGTACGG 
CTCACGCAGA GCCTGGCCGT GCTCCGGGGA CGGCCGCTGG CGGGGCTGGC GGAGGTCACC 
GAGGCGGCCA GGGCTGTGCT GTGCGAGGGC GACGACCTGC CGGTGGAGCT GATCCAGCGG 
CGCATGGTCG TGGGGGAGCG GCTCGGCCAC GTCCCCGACA CGACCCCGAT GGTCCCTCTC 
CAGCGCCACC TCCGCGAGGA GCAGCGGCGG CTGAAGCTCA AGCCCGAGGC CCTGGACCGC 
GAGCACGATC TCGACCTGCG CAAGCCCCTC GACCTGGAGC GCAGCAGGCT GCTGCACCGG 
CTGCGGCTGC TCGGCGTGGA GTGGGGCACG CCCCAGGAGA GCCGGAGCAA GGGCACCTTC 
CGCGAGTCGT GGACGCTCGC CTGGCGTCCC GAGTTCGACA TCGAGCTGAT CGAGGCGAGC 
GCCTGGGGCA CCACGGTCCC CGCCGCGGCC GGCGCCCGCG TCCGCGATCT CGCGGACGGA 
GGACGGCCGC CCGGCCCGGC CGCGCCGCAG GGGACCGCCG GACCGGGACC CGGGGGCGGC 
GGATCCGCCG CACCCGCCGG GGTCTCGCTG GCCGGGCTCA CCGGGCTGGT GGAGCGGTGC 
CTGCTCGCGG ATCTGCCGGA CGCGCTGCCG TACGTGCTCG ACTCGCTGTC GGCGCGGGCC 
GCACTCGACA GCGACGTCAC GCACCTGATG GCGGCGCTGC CCGCGATGGT CCGCGCGCAG 
CGCTACGGCG ACGTGCGCGG CACCCCCGCC ACCGGCCTGG CCGCCATCGT CGACGCCCTG 
CTCACCAGGG TCTGCGTCGG GCTGGGCGGA GCGGTCACCG GGCTGGACGA CGACGCGGCC 
CGCGACCTGC TGCGCCACAT CGACGGGGTG CACGCCGCGG TGGCCCTGCT CGACGGGGCC 
ACCGGCGCGG AAGCGCCCCA GGGCCGCTGG CTTGCCACGT TGCGCGGCGC GTCGGGCCGC 
TCCGACCTGC ACGGGCTGAT CGAGGGCCGG CTCACCAGGA TCCTGCTGGA CGCCGGTGAC 
CTCGACGCCG ACCAGGTGGG CCCGCGGATG TCGCGGGCCA TGTCGGCCGG GCACCCGCCG 
GCCCGGGCGG CCGCCTGGAT CGAGGGATTC CTGTCGGGCG GCGGCCTGCT GCTCGTCCAC 
GACGCCCGGC TGCTCGCCCT GATCGACGGC TGGCTCACCG GGCTCGCCCC GGAGACGTTC 
GTGGACGTGC TGCCCCTGCT CCGCCGGACG TTCGGCGCCT TCGCGGCGCC GGAGCGGCGC 
TCGATCGGCT CGCGGGTCCG CTCGCTCGCG ACCGGGGCGG TTGCGGGCGG GGAGGACGTC 
GCGGAGCTCG ACGAGGAGCG GGCGGCGGCG GCCGTGCGGA CCGTGCTGAT GATCCTGGGG 
AAGACGGAGG CCGAGTGA

Protein sequence

MSVSVLGVRH HGPGSARSLG DELERLKPDI VLIEGPPEAD GLVELAKDPG LEPPVALLAH 
VPGEPSKAAF WPFAVFSPEW QAIRHAVEAG IPVRFCDLPA AHSLASGPEE PAARPDTPDT 
PDGEGPDSGI PAAVRTDPIG TLARAAGYDD PERWWEDVVE HRGDTPFQVI AEAMAAVREG 
HVADAYEARR EAFMRRTIRR AVKDGFERIA VVCGAWHVPA LAGPSREGAA WGAGLPTVKA 
DDALLRGLPK VKAEMTWVPW TYGRLAAWSG YGAGVTSPGW YHHLFTAADR PVERWLTAAA 
GVLREEDLPV SSAHVIEAVR LTQSLAVLRG RPLAGLAEVT EAARAVLCEG DDLPVELIQR 
RMVVGERLGH VPDTTPMVPL QRHLREEQRR LKLKPEALDR EHDLDLRKPL DLERSRLLHR 
LRLLGVEWGT PQESRSKGTF RESWTLAWRP EFDIELIEAS AWGTTVPAAA GARVRDLADG 
GRPPGPAAPQ GTAGPGPGGG GSAAPAGVSL AGLTGLVERC LLADLPDALP YVLDSLSARA 
ALDSDVTHLM AALPAMVRAQ RYGDVRGTPA TGLAAIVDAL LTRVCVGLGG AVTGLDDDAA 
RDLLRHIDGV HAAVALLDGA TGAEAPQGRW LATLRGASGR SDLHGLIEGR LTRILLDAGD 
LDADQVGPRM SRAMSAGHPP ARAAAWIEGF LSGGGLLLVH DARLLALIDG WLTGLAPETF 
VDVLPLLRRT FGAFAAPERR SIGSRVRSLA TGAVAGGEDV AELDEERAAA AVRTVLMILG 
KTEAE