Gene Sros_5000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5000
Symbol
ID	8668294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5525208
End bp	5526428
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340542
Protein GI	271966346
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.728211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.505446
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCTGT CCGACCCCAT CCGCTACGGC GCCAACTACG TGCCCTCGGC CGGCTGGTTT 
CACAGTTGGC TCGACCTCTC GCTCGACGCC GCCCGCCGCG ACTTCGAGGA CCTGGCCTCG 
ATCGGCCTGG ACCACGTGCG CGTGTTCCCG ATCTGGCCGT GGATCCAGCC CAACCGGGCG 
CTGATCCGGC AGCGCGCCGT GGACGACCTG CTGGCGCTGA TCGACGTCGC CGCCGAGTTC 
GGCCTGTCCG TCGCCGTGGA CCTGCTCCAG GGACACCTGT CCAGCTTCGA CTTCCTGCCG 
TCGTGGGTGC TCACCTGGCA CCGGCGCAGC CTCTTCACCG ACCGCGGCGT GCGCGACGGC 
ATCGCCGCGT ACGCCGACCG GCTCGCCCGC GCCGTCGCCA CCCGCGACAA CGTGTTCGCC 
GTCACGCTCG GCAACGAGGT CAACAACCTC TACCCGAGCA ACCCCACCAC GCCCGAGGCG 
TCCACGGCCT GGGCCGCCGA ACTGGTCGAC GTCGTGCGCT CCGCCGCGCC GGGCCTGCTC 
GCCCTCCACT CGCTGTACGA CGCCACGTGG TACGACCCGG AGCACCCGTT CCATCCCGCC 
GACAACGTGG ACCTCGGCGA CCTGACCACG GTCCACTCCT GGGTGTTCAA CGGCGTCTCC 
GCGATCGACG GCCCGCTCGG CCCGGCCACC GTCGGCCACG CCGACTACCT CGTCGAACTG 
GCCGCGGCCA CCTCGCTCGA CCCGGCCCGG CCCATCTGGC TGCAGGAGAT CGGCGTTCCC 
CTGCCCGACG TGCCCGAGGC CCACGCCGCC GAGTTCGTCC GCCGCACGCT CGACACGGTG 
ACCGCCAACC CCGCCCTGTG GGGCGTCACC TGGTGGTGCT CCCACGACCT GGAACGTTCC 
CTCACCGACT TCCCGGAGCG TGAGTACGGC CTGGGCCTGT TCACCGTGGA CCACCGCCCC 
AAGCCCGCGG CCAAGGAACT CGCGGCGATC ATCGGCGAGC GCCGCCGCCG TACCGGGGAA 
AGGCGCCCCG CCCTGCGGTG CGACGTGGAC CTGCGGACCG AGCCCGGCCG CCGGGCCGAG 
GTCGCGCCCG GCAGCGCCTT CCACACCGAA TGGGTCCGGC TGCGCCAGAC CGGACCAGTG 
GCCATCGTCG CCGGCGACCG CGCCGCCGAC CCGGGCCACC TCACGACTCG GGGAATCGAC 
ACCGTCCTCA CCCAGGAATG A

Protein sequence

MPLSDPIRYG ANYVPSAGWF HSWLDLSLDA ARRDFEDLAS IGLDHVRVFP IWPWIQPNRA 
LIRQRAVDDL LALIDVAAEF GLSVAVDLLQ GHLSSFDFLP SWVLTWHRRS LFTDRGVRDG 
IAAYADRLAR AVATRDNVFA VTLGNEVNNL YPSNPTTPEA STAWAAELVD VVRSAAPGLL 
ALHSLYDATW YDPEHPFHPA DNVDLGDLTT VHSWVFNGVS AIDGPLGPAT VGHADYLVEL 
AAATSLDPAR PIWLQEIGVP LPDVPEAHAA EFVRRTLDTV TANPALWGVT WWCSHDLERS 
LTDFPEREYG LGLFTVDHRP KPAAKELAAI IGERRRRTGE RRPALRCDVD LRTEPGRRAE 
VAPGSAFHTE WVRLRQTGPV AIVAGDRAAD PGHLTTRGID TVLTQE