Gene Sros_4233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4233
Symbol
ID	8667527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4717489
End bp	4718781
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	75%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339878
Protein GI	271965682
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.121217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0238527
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACTT ACCGCGAGCT CCTGCGCACG CCGGAGTTCA CTCCGCTCTT CCTGACCGTC 
TCCGCGCAGG TGGCGGCCGC GACCGTGAGC GGGCTGGCGC TGGGCGTGCT GGTGTACGCG 
GCCACCGGGT CACCGCTGCT GGCCGCCCTC AGCATGTTCG GTCCCTCGCT GGCCCAGGCG 
ATCGGCGCGG CCGCGCTGCT GTCGGCCGCC GACCGGCTTC CGCCGCGCGC CGCGATGACG 
GGAGTGGCCC TGGCCTTCTG CCTCGGCACC GCCGCCCTGG CCGTGCCCGG GCTGCCGCTG 
CCGGGCATAT TCGCGATCAT CCTGGGGCTC GGCCTGGTCG GCTCGGTGGG CGGCGGGGTG 
CGCTACGGGC TGCTGAACGA GATCGTGCCC GCGGACGGCT ACCTGCTCGG GCGGTCGCTG 
GTCAACATGT CCGTCGGGAT CATGCAGGTC TGCGGGTTCG CGGCGGGCGG CGTGCTGGTG 
TCGGTGTTGT CGCCGCGCGG CACGCTGCTG GCCGGGGCCG CCCTGTATCT CGTCGCCGCG 
GGCACCGCCA GGTTCGGCCT CAGCGCGCGG GCGCCACGGG CCGTGGGGCG GCCGTCGGTG 
GCCGCGACGT GGCGCTCCAA CGTGCGGCTG TGGTCCTCGG CGCCCCGTCG CCGCGTCTAC 
CTCGCGCTCT GGGTGCCGAA CGGGCTGATC GTCGGTTGCG AGTCGCTGTT CGTACCGTTC 
GCGCCCGAGC AGGCCGGGAC GCTCTTCGCC TTCGCCGCGT CCGGCATGCT GGCCGGGGAC 
GTTCTGGTCG GCAGGTTCGT GCCGGCGCGG TGGCAGGCGC GGCTCGGCGC CGCGCTGCTG 
CTCCTGCTGG CCGCGCCGTA CCTGGTGTTC GCCGTGGACC CGCCGGTGCC GCTCGCCGTC 
GCGGCCGTGA CGGTGGCCTC GATCGGATAC GCGGCGAGCC TGGTGCTGCA GCAGCGGCTG 
ATGGACCTGA CCCCGGCCGA GATGAGCGGG CACGCGCTGG GGCTGCACTC CTCCGGCATG 
ATCACCATGC AGGGTGTCGC CGCCGCCCTC GCCGGCACGC TCGCTCAGTA CACCTCGCCG 
GGGACGGCGA TCGCCGTCAT GGCGGCGGCG TCCGTGACGG TCACGCTGGC GCTGGCGCGC 
GGCCTCTCCG GGCCGGCACG CACAGGCCCG TCTCAGAGAG CGCGCGCCGA CATCGAGCGG 
CACGGCGACG CCGGGAACCC GGCGGCACCG CCCCAGGCCG GTCACCTCGC CGGGAACGCT 
CCGCCGGCCA CCGGAAACCG GCGGACGACG TGA

Protein sequence

MRTYRELLRT PEFTPLFLTV SAQVAAATVS GLALGVLVYA ATGSPLLAAL SMFGPSLAQA 
IGAAALLSAA DRLPPRAAMT GVALAFCLGT AALAVPGLPL PGIFAIILGL GLVGSVGGGV 
RYGLLNEIVP ADGYLLGRSL VNMSVGIMQV CGFAAGGVLV SVLSPRGTLL AGAALYLVAA 
GTARFGLSAR APRAVGRPSV AATWRSNVRL WSSAPRRRVY LALWVPNGLI VGCESLFVPF 
APEQAGTLFA FAASGMLAGD VLVGRFVPAR WQARLGAALL LLLAAPYLVF AVDPPVPLAV 
AAVTVASIGY AASLVLQQRL MDLTPAEMSG HALGLHSSGM ITMQGVAAAL AGTLAQYTSP 
GTAIAVMAAA SVTVTLALAR GLSGPARTGP SQRARADIER HGDAGNPAAP PQAGHLAGNA 
PPATGNRRTT