Gene Sros_4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4053
Symbol
ID	8667347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4512635
End bp	4513873
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339704
Protein GI	271965508
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0744833
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCCGGG TGAGTGTCGC GCTCGGATTG AACCGTCCCC TCGTGGTGAG AACCACGCTC 
GTCGGCGACC CCGGCGACCT GCTCGCGCGA CTTCCCGCGG CCGCCCCCTA CGCCTGGATC 
AGGCACGGCG AGGGTATGGT GGCCTGGGGA GAGGCCGCAC GGGTGGCTGT GCCACCCGGC 
CCCAGGCGTT TCGAGTGGGC TCGTGACTGG CTGTCGGAGA CCTTCGGCGA GGCCCATGTC 
GACGACGACG TGGGCGTCCC CGGCTCGGGC CCGGTCGCCT TCGGTTCCTT CACCTTCGAC 
CCCGACGCCC AGGGCTCGGT CCTCGTCGTC CCGCGGGTCG TCCTGGCCCG CCGCGACGGC 
CGCGCCTGGC TGACCACCCT CGGCGAGGAG CGGCTCGACC TGGTCACCCC GCTCCGCGAC 
CCCGGCAGGA TCCGGTACGG CGACGGCAGC CTGACCGCTC CCGAATGGGA GCACGCCGTG 
GCGCGGGCCG TCGGGCAGAT CAGGTCCGGG CGCCTGGAGA AGGCCGTGCT CGCCCGCGAC 
CTGACCGCCA CGGCGGAGCG GGAGATCGAC GTCCGCCTGC TGCTGTCACG TCTGGCCCGC 
CGCTATCCCG GGTGCTACAC CTTCTCCTGC GCCGGCCTGG TCGGCGCCAC CCCCGAGCTG 
CTGGTCCGGC ACACCGGCGA GACGATCGAG TCCCTGGTGC TGGCTGGCAC GGCCTCCAGG 
GGCACGGACG AGGCCGACGA CATGGCGCGC GGCGCCGCCC TGTTCGCCTC GGAGAAGGAC 
CGCTACGAGC ACACCTGCGC GGTGGAGTCG GTCCGGGAGG CGCTGGCCCC GCTCTGCTCC 
GAGCTGAAGG TGCCCGAGGA GCCCGAGCTC CTGGTCCTGT CCAACGTCCA GCACCTGGCC 
AGCCCGGTGA CCGGGCGCCT GTCGGCCGGG GCCTCGGTCC TGGACGTGGT GGCCGCCATG 
CACCCGACGG CCGCCGTCGG CGGGACGCCC ACCGAGACGG CGCTCGGCGT GATCCGCGAG 
CTGGAGGGCA TGGACCGCGC CGGTTATGCC GGGCCGGTCG GCTGGATCGA CGCCCGGGGC 
GACGGCGAGT GGGGCATCGC GCTGCGCTGC GCCCAGATCG AGGGCCGCCG GGCCCGCCTG 
TTCGCCGGCT GCGGCATCAT GGGCGACTCC GCGCCGGCCG CCGAGCTGGC CGAGGCCCAG 
GCCAAGCTCC GCGTGATGCA GTACGCCCTG GAGGGCTGA

Protein sequence

MFRVSVALGL NRPLVVRTTL VGDPGDLLAR LPAAAPYAWI RHGEGMVAWG EAARVAVPPG 
PRRFEWARDW LSETFGEAHV DDDVGVPGSG PVAFGSFTFD PDAQGSVLVV PRVVLARRDG 
RAWLTTLGEE RLDLVTPLRD PGRIRYGDGS LTAPEWEHAV ARAVGQIRSG RLEKAVLARD 
LTATAEREID VRLLLSRLAR RYPGCYTFSC AGLVGATPEL LVRHTGETIE SLVLAGTASR 
GTDEADDMAR GAALFASEKD RYEHTCAVES VREALAPLCS ELKVPEEPEL LVLSNVQHLA 
SPVTGRLSAG ASVLDVVAAM HPTAAVGGTP TETALGVIRE LEGMDRAGYA GPVGWIDARG 
DGEWGIALRC AQIEGRRARL FAGCGIMGDS APAAELAEAQ AKLRVMQYAL EG