Gene Sros_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2022
Symbol
ID	8665304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2174431
End bp	2175654
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	70%
IMG OID
Product	putative oxidoreductase
Protein accession	YP_003337753
Protein GI	271963557
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.461121
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.126773
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCCG GCATGACCAC CACACCGCGG CTCACCGAGC CGAAGAACAA GGACATCCTG 
ATCTCCGGGG CCAGTGTCGC CGGTCCGGCG CTGGCCTACT GGCTGCGCCG CCACGGCTTC 
AACCCCACGG TGGTGGAGCG GGCGCCCGCG CTGCGCGACG GCGGTTACGC GGTCGACTTC 
CGCGGCGAGG CGCACCTCAC CGTGCTGGAG CGGATGGGCA TCCTGGCCGA CGTCCGGAGC 
GCGCGGACGC GCATGGGCGC GATGTCCTAC GTCAACAGCG CCGGCAGGAA GCTGGCGAGC 
CTGCCCGCCG ACCTCTTCGC CGGTGACGTC GAGATCCTCC GCGGCGACCT GGCCCGCATC 
CTCCACGAGG CGACCAGGGA GCACACCGAG TACGTCTTCG ACGACTCCAT CGCCTCCATG 
ACCGAGGACG CCGACGGCGT GACCGTCACC TTCGAGCGCG GGGCGCCGCG CAGGTTCGAC 
CTGGTGGTGG GGGCCGACGG GCTGCACTCC AACGTGCGCT CGCTCGCGTT CGGGCCGGAG 
TCGCGGTACG TGAAGGAGCT GGGCCTGTAC TGCGCGATCT TCACCACCGC CAACCACCTC 
GGGCTGGAGT ACACCGGGCA CGCCTACAGC ACCCCCGGCA AGCTCACCTC CGTGTACAGC 
GCCCGGCACA ACACCGAGGC GAAGGCCATG TTCTACTTCG GCTCGCCCCC GCTGAGCTAC 
GACCGCCGCG ACGGCGAGCA GCAGAAGAAG ATCCTCGCCG AGGCGTTCGC CGGGATCGGC 
TGGGAGACGC CCCGGCTGCT GAAGAGCATG TGGGACGCGC CGGACTTCTA CTTCGACTCG 
GTCAGCCAGG TCCACCTGGA CCGCTGGTCC CGGGGCCGGG CCGTCCTGCT CGGAGACGCC 
GCCTGCTGCC CCTCGCCCCT GTCGGGCATG GGCACCGGCC TGGCCGTGGT CGGGGCCTAC 
GTGCTGGCCG GGGAACTGGC GGCCGCCGGG GGTGACCACC GCGCGGGCTT CGCCCGCTAC 
GAGGAGGCCA TGCGTGACTA CGCCACGGGA TGCCAGAAGT CGGGCGAGGG CGTGAGCAGG 
TGGATGGTCC CCGAGAACCG GTTCATGGCC TGGTTCCTCA ACCAGAACTA CAGGCTGCTG 
CCGTACCTGC CGTGGAAGGG GCTGATGGCC AAGAGCGTCC GGAAGACGGC GAGCGCCATC 
GCCCTGAAGT CCTACGGGCT CTGA

Protein sequence

MLAGMTTTPR LTEPKNKDIL ISGASVAGPA LAYWLRRHGF NPTVVERAPA LRDGGYAVDF 
RGEAHLTVLE RMGILADVRS ARTRMGAMSY VNSAGRKLAS LPADLFAGDV EILRGDLARI 
LHEATREHTE YVFDDSIASM TEDADGVTVT FERGAPRRFD LVVGADGLHS NVRSLAFGPE 
SRYVKELGLY CAIFTTANHL GLEYTGHAYS TPGKLTSVYS ARHNTEAKAM FYFGSPPLSY 
DRRDGEQQKK ILAEAFAGIG WETPRLLKSM WDAPDFYFDS VSQVHLDRWS RGRAVLLGDA 
ACCPSPLSGM GTGLAVVGAY VLAGELAAAG GDHRAGFARY EEAMRDYATG CQKSGEGVSR 
WMVPENRFMA WFLNQNYRLL PYLPWKGLMA KSVRKTASAI ALKSYGL