Gene Sros_4581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4581
Symbol
ID	8667875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5094512
End bp	5096503
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340186
Protein GI	271965990
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.267565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCGGA GAGTGGACTA CGCGGCGCGG GCCGTGGCCC TGTCCCTGGG CGCGCTCGGC 
CTCGCGGCGC TGGCCGCGCA CGTGGTCATC GAGCTCGCGA TCAACCCCCG GCCGCCCGGC 
ATCGGTGACA CCGCCCGCGT CCAGGCGCTG CTCAGCACCC CGCTGGGCAT GCTGATCGTG 
CTGCGCCGGC CCGGACTGAT CGTCGGCTGG CTGCTCCTGC TGGTCGGCGC GGCCAACGGC 
TGGGTGACGC TCGCCATCTC CCTGTACGAG GTGTACGGGC AGGGCGCGGT GCCGCTCCCG 
CCGCTGCTCT ACTGGCTCCT CGGCTTCCGC GGCGCCGTCA CCACCTGCAC GGCGCTCATG 
CTGCCGCTCG CGCATCCGGA CGCCGGCCTG CTGCGGCCCC GATGGCGCTG GGTCTACCTG 
GCGCTGATCT CGTGGCAGCT GCTCCTGCTG GCGATCGCCA TCCCGCGGCT GCACGAGTCC 
GCCGGGCCGC TCGCGAGCCT GTACCAGGTG TCCGCCGTGA TCTGCGGGCC GCTGCAGTGG 
GTGAGCCTGC TCGTGCTACT CGTCCGGTTC TGGCACGCCG ACCCGGACGC GCGGCGGCAG 
ATCGCCTGGC TGGCGCCCGT CGTGGCCTTC GACAACCTCG CCTTCACCGA GATCCTCGGC 
TGGGACTACC TCTGGCTGGA CACCATCGGC GAGGCGGCCG TGCCGATCGC GGTGGCCATC 
GCCGTACTCC GCTACCGGCT CTACTCGATC GACACGCTTG CCAGCCGGGC CCTGGTCGGA 
GGCGCCCTGG TGGTCTTCGT CGCCACGGCG TACCTGGCCG TCGGCGCGCT CACCGGACTC 
TTCCTGGCCG ACTACGGCGA GCTCTTCGGC GTGGTCGCGG CGATCCTCGC GGGCCTGTCG 
TTCCTGCCCG TCCAGCGGCG CCTGCAACGC CTGCTCGACC GGCTCCTGTA CGGCAGGAGC 
GGCGACCCCC AGGCGCACGC CGAAGCCCTG CGGCGGCAGA TCCAGCACGC CGGTCCCTCC 
CAGGCGCTGG AGGCGGCGGT GCGGGCGGTG GCCGACGGCC TGGCGGTGAC CGGGGTGGCG 
GTCCAGACCG AGGAGAGCCA CGTCGTCGGC GAGCTCGGGG ACGACCCTCG CAAGGTCCCC 
CTGGTGTGGC ATGGCGAACC CGCCGGGACG CTGCTCCTCG GCCCACCCGG GGCGCGGCGC 
TTCCCCCGGG CGTACGAGCG GCGGATGCTG GCCGTCCTGG TGCCGATCGT CGCCGACGTC 
GCGCATGCCG TACAGATGGC TCATGACCTG CGACGTTCAT GGGAACGGGC GGCCGGGGCG 
CGGGAAGAGG AGCGGCGGCG GCTGCACCGG GACCTGCACG ACGGGCTGGG GGGCAGGTTG 
GCCGGGATAA CGATCGGGCT GGAGGCGGTG CGGCGATCCC TGGGCTCCCC TGACCTGGCC 
TATCGGCTGC TGTCCGATCT CCGGGTGGGG ATGGACGACG TGAACGGCGA GATGCGGGAG 
CTGGTGCAGG GCCTCCGGCC CCGCGCACTG GACGCGATCG GGCTGGAGCA GTCGATCCGG 
CTGCTGGCGG GGGAGGTGCC GGTCACCGTC AGGGGAAGCC TGGAGGGACT GCCCCCCCGC 
GGTGGAGGTC GCGGCGTACC GGATCGTGCA GGAGGCGCTG ACCAACGCCC GGCGTCATTC 
CGGTGCGGAG GTCATCACCG TGGTGCTGGA GCGGGCGGGC GACCTGCGGG TGCGGGTCAC 
CGACGACGGG GTGGGTGTCG GCGCGTCGGC TCGGGGCTCG GGCTTCGGCC TGTCGACGAT 
GCGCGAACGG GCCGCCGAGG TGGGCGGCAC CTGCTCGGTC CGTGGCGGCG AGCACGGCGG 
CACCGTGGTC GAGGTTGTTT TTCCCGTCCC GACATGACCG GTGGGGGCAG CCCGCCGCGC 
GGGAACGCTT ACATCTCCTG GCGGCGGCGC AAACAGCCGG AGTCGCCCGA CGCGGCCCAA 
GGCTCCTGCT GA

Protein sequence

MRRRVDYAAR AVALSLGALG LAALAAHVVI ELAINPRPPG IGDTARVQAL LSTPLGMLIV 
LRRPGLIVGW LLLLVGAANG WVTLAISLYE VYGQGAVPLP PLLYWLLGFR GAVTTCTALM 
LPLAHPDAGL LRPRWRWVYL ALISWQLLLL AIAIPRLHES AGPLASLYQV SAVICGPLQW 
VSLLVLLVRF WHADPDARRQ IAWLAPVVAF DNLAFTEILG WDYLWLDTIG EAAVPIAVAI 
AVLRYRLYSI DTLASRALVG GALVVFVATA YLAVGALTGL FLADYGELFG VVAAILAGLS 
FLPVQRRLQR LLDRLLYGRS GDPQAHAEAL RRQIQHAGPS QALEAAVRAV ADGLAVTGVA 
VQTEESHVVG ELGDDPRKVP LVWHGEPAGT LLLGPPGARR FPRAYERRML AVLVPIVADV 
AHAVQMAHDL RRSWERAAGA REEERRRLHR DLHDGLGGRL AGITIGLEAV RRSLGSPDLA 
YRLLSDLRVG MDDVNGEMRE LVQGLRPRAL DAIGLEQSIR LLAGEVPVTV RGSLEGLPPR 
GGGRGVPDRA GGADQRPASF RCGGHHRGAG AGGRPAGAGH RRRGGCRRVG SGLGLRPVDD 
ARTGRRGGRH LLGPWRRARR HRGRGCFSRP DMTGGGSPPR GNAYISWRRR KQPESPDAAQ 
GSC