Gene Sros_1739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1739
Symbol
ID	8665016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1854516
End bp	1856156
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	76%
IMG OID
Product	Sulfite oxidase-like protein
Protein accession	YP_003337473
Protein GI	271963277
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.316961
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCGT GGGCGGCGGC GCTGATCGGC CTGGTGTCCG GTGCGGTGGC GGTGGGGGTT 
TCCCTGCTGG CCGCGGGCCT GGTGAAAGCC TCGGCCTTCC CGGTTGTCGC GGTCGGCAAC 
GCCGCCGTCG ACCTCACCCC GGCCGCGCTG AAGGACTTCG CCATCCGCAC CTTCGGCGAG 
AACGACAAGA TGGTCCTGCT GACGGGCATC TTCCTGGTCC TCGCCGCGAT CGCCGCCGCC 
GTCGGAGTCC TGGCGGTCCG GGACCTCCGG TACGGCCTGG CGGGCCTGGC CGCCTTCGGC 
GTCGTCGGCG TCCTGGCCGT CCTGACCCGC CCCGGCGCCG CGGTCGTGGA CGTCGTCCCC 
ACGGTGGCGG GCGTCGCCGC CGCCATGTTC GCCCTGCACC GCCTCACCGC CCGCGCCCTG 
GCCCCGCCGG CCGGCCCGCG CGAGGCGGGT CCGCCGGCCG GCCCGCACGG CACCGGCCCG 
AGCGGCGGGG AACCCGCCGC CGGAGCTGGA GGGGAGGAGC GGTACGGCGC GCCGGTCCCG 
CCGGTCATGC GGGCGGGGAA CGGCCCCTAC CCGTTCGACC GGCGCAGGCT GCTGATCGGG 
ACGCTGGGTG GAGTCGCCGT CGCCGGAGCG GCCGGCGTGG CCGGGCGGAT GCTGTCGGGC 
CGGGCGGAGG TGGCCGCGGC CCGGGTCGGC ATGGCACTGC CCCGCCCCGC CGTCCCCGCC 
GCGCCGCTCC CGGCCGGCGC AGACCTGAAG ATCAGAGGGC TGTCGCCGTT CGTCACCCCG 
AACCACGACT TCTACCGGGT GGACACCGCC CTCGTGCTGC CCCAGGTGGA CCCCCGCGAC 
TGGACCCTGC GGATCCACGG CATGGTGGAC AGGCCCGTCG AGCTGACCTT CGCCGACCTG 
ATGAAACGCC CCCTGGAGGA GGCCGACATC ACGCTGTGCT GCGTCTCCAA CGAGGTCGGC 
GGCCCGTACA TCGGCAACGC CCGCTGGCTG GGCACCAGCC TGGCGGGCGT CCTGCGCGAC 
GCGGGGGTGC GGAAGGGGGC CGACATGCTG CTCAGCACCT CCGCCGACGG CTGGACCTGC 
GGCACCCCGG TGGACGTCGT CCTCGACGGC CGCGACGCGC TGCTGGCCTT CGGGATGAAC 
GGCGAGGCGC TCCCGGTCGC GCACGGCTTC CCGGTCCGCC AGGTGGTCCC CGGCCTCTAC 
GGCTACGTCT CGGCGACCAA GTGGGTGACG GAGATCAAGG TCACCAGGTT CGACCGGGAC 
GAGGCCTACT GGACGCCCAA GGGGTGGTCG GCCAGGGGGC CGGTCAAGAC GCAGTCGCGC 
ATCGACCTGC CGAGGGACGG CGCCCGCGTC GCGCCGGGCC GTACGGTGAT CGCGGGAGTC 
GCCTGGGCGC AGCACAAGGG GGTGGACGCC GTCGAGGTGC GGATCGACCG GGGGCAGTGG 
CGCCAGGCGC GCCTGGCCGT GGCGCCGACC GCCGACACCT GGCGCCAGTG GGTGGTCGAC 
GACTGGGACG CCACCCCCGG CAGCCACACC ATCGAGGTGC GGGCCACCGA CGCCACCGGC 
TACACCCAGA CCCCCGACCT CGCCCCGGTG GCCCCCGACG GGGCCACCGG CTGGCACAGC 
GTCAGCGTCG ACGTCGCCTG A

Protein sequence

MPPWAAALIG LVSGAVAVGV SLLAAGLVKA SAFPVVAVGN AAVDLTPAAL KDFAIRTFGE 
NDKMVLLTGI FLVLAAIAAA VGVLAVRDLR YGLAGLAAFG VVGVLAVLTR PGAAVVDVVP 
TVAGVAAAMF ALHRLTARAL APPAGPREAG PPAGPHGTGP SGGEPAAGAG GEERYGAPVP 
PVMRAGNGPY PFDRRRLLIG TLGGVAVAGA AGVAGRMLSG RAEVAAARVG MALPRPAVPA 
APLPAGADLK IRGLSPFVTP NHDFYRVDTA LVLPQVDPRD WTLRIHGMVD RPVELTFADL 
MKRPLEEADI TLCCVSNEVG GPYIGNARWL GTSLAGVLRD AGVRKGADML LSTSADGWTC 
GTPVDVVLDG RDALLAFGMN GEALPVAHGF PVRQVVPGLY GYVSATKWVT EIKVTRFDRD 
EAYWTPKGWS ARGPVKTQSR IDLPRDGARV APGRTVIAGV AWAQHKGVDA VEVRIDRGQW 
RQARLAVAPT ADTWRQWVVD DWDATPGSHT IEVRATDATG YTQTPDLAPV APDGATGWHS 
VSVDVA