Gene Sros_9250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9250
Symbol
ID	8672598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10200096
End bp	10201766
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003344611
Protein GI	271970415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.357084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.998614
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACAC CCTCACGTAA GGCCTCACGC GCGACGGTGA TCACTGTAAG CATCGCAATC 
GGCGTGTTCG GGGCCGGCGC CGGGCTGGGA ACCGTCATCG CCTCCCGTTC CCATCCCGAC 
GAGGGGCAGG TGCTGCGCCT GGCGGCGGGC ACCTATCACC TGGCCGACGG CGAGCGGGCG 
TGGAAGTCCC GAGGAGCGGC CGACAGGGAT CAAGGCGTCC CTCTCTCCGG CGCCGACGAG 
GGCAGCACGA TCGCGAAGAA GGAGTCCAAG GACCCCCGGC TCTGCCTGAC CGCCACCGCC 
GACGGGCACG CGGTCGGCGG CGGCGCGGCG GGGTGCGTCG CCCTTCCCGC GGTCCTGGCC 
GGCGCCGCCG CCCCCCTGCA GCGGCCGGGA AATCCCAGGA GCACGGGGTC GGCACCGCCC 
AAGAAGGCCT CCTCGGCCCC GGAACCCCGC CGCTCGACGG CGGCGCAACC CGCCCCGGCC 
ACCCGCCGCA CGGCGGCGCA GCCCGATCCG GCCCCCCCAC GTACGGCGGC GCAACCACCT 
CCGGCGAGAC CGGTCCGCTC CGCGCCCTCC CCGACGCAGA CGAAGAAGAT CGCCGGCGAC 
ATCTCGGAGA GCGGCAGCCT GGTCGAGAAG CCCGCGGCGC AGGCCGAGAA GAAACGTGAC 
GTCAACACCG CTCCGAAGGA GCCGACTCCC AAGTCCGCAC CGCCTTCGGG GACCCCCCGG 
CCGGAGGCGT CCCCCAGCGC CGTCCAGCCC ACGCCCCCTC CGAACACGGC CAAGCCCACC 
GCGACCACCA CGCCTCCGGG CACCGCGGAG CCGAGCCGGC CGACGGCGAC CCCGAGACCT 
TCGCACACCC ACAGGAAGCG GAACCCCCAC CGTCCGGGGA ACCCCACCCC TTCGGGCACC 
CTCCCGCCGG CCCAGCCCTC AAGCCCCGTC ACGCCCTCCC CGGACACGCA GCTCCCCACT 
CCGGCCCCGG ACACGCAGCT TCCCTCGCCG GACCAGAACC CGTCCCAGAC TCCCGACGCA 
ACCGTGCTGC CAACCGCCCA GCCGTCCGCT CCGAACGGGG AGATCACCGA GAACGGCGAC 
TCCCTGCCGA TCTTCCAGGA CCCGGAGCTG CTGCGGCGGG CCCAGGAGGC CCTGGGACTG 
GACAGGAACA TGCGCTACAC GGATGAGAAC GGCGTATGGG ACCTCAACAT CGCCCCGCCG 
GGCACTCCCC CGTGCCGGAA CTACTCGGCC GCCGAGCTTC AGAAGCTGGA TGCGCCCCAG 
AGCGGCAGCC CGGCCATCCC CCGCGACTCG TGCCAGTGGC CCGCCTTCAT CCGCTGGCTC 
TACGCGGAGC CGGCGCCCGG GGAGGTCAGC AACTGGACCA AGTTCACCGG CCTGCCCGAG 
CGGAACCTGG AGCTCGTGGT GACGGATCCC TCCACCCTGC CGCCCGCGCC GGCCGGCACC 
AGCCAGGTCG AGCCGGACAC CGGCCAGGTC CAGCCCGACA CCCGCCAGAT CCGGCCTGAC 
ACCCGCCAGG TCCAGCCGGA CACCCGCCAG GTCCAGCCCG GAACCGGCCA GGTCCAGCCG 
GACACCCAGC AGATCCGGCC TGACACCCGC CAGGTCCGGC CCGACACCGG CCAGGTCCAG 
CCTGGCACCG GCCAGGTCCA GCCGGACCCG TTCGGATACA ACGACCAATG A

Protein sequence

MMTPSRKASR ATVITVSIAI GVFGAGAGLG TVIASRSHPD EGQVLRLAAG TYHLADGERA 
WKSRGAADRD QGVPLSGADE GSTIAKKESK DPRLCLTATA DGHAVGGGAA GCVALPAVLA 
GAAAPLQRPG NPRSTGSAPP KKASSAPEPR RSTAAQPAPA TRRTAAQPDP APPRTAAQPP 
PARPVRSAPS PTQTKKIAGD ISESGSLVEK PAAQAEKKRD VNTAPKEPTP KSAPPSGTPR 
PEASPSAVQP TPPPNTAKPT ATTTPPGTAE PSRPTATPRP SHTHRKRNPH RPGNPTPSGT 
LPPAQPSSPV TPSPDTQLPT PAPDTQLPSP DQNPSQTPDA TVLPTAQPSA PNGEITENGD 
SLPIFQDPEL LRRAQEALGL DRNMRYTDEN GVWDLNIAPP GTPPCRNYSA AELQKLDAPQ 
SGSPAIPRDS CQWPAFIRWL YAEPAPGEVS NWTKFTGLPE RNLELVVTDP STLPPAPAGT 
SQVEPDTGQV QPDTRQIRPD TRQVQPDTRQ VQPGTGQVQP DTQQIRPDTR QVRPDTGQVQ 
PGTGQVQPDP FGYNDQ