Gene Sros_3856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3856
Symbol
ID	8667146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4295844
End bp	4297070
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	72%
IMG OID
Product	sarcosine oxidase subunit beta
Protein accession	YP_003339517
Protein GI	271965321
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.014492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0224272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCC ACGACGCCGG CCCGCCCGAG CACCCCGACC GGCTGTGGAA CAGCCCCGAG 
CCGGCGGCCT CCTACGACGT GGTGATCGTC GGAGGGGGCG GCCACGGCCT GGCGACGGCC 
TACTACCTGG CCAGAGACCA CGGGATCACC AACGTGGCCG TACTGGAGAG GGGCTGGCTG 
GCGGGCGGCA ACATGGCCCG CAACACCGCC ATCATCCGCT CCAACTACCT CCTGGACGAG 
AGCGCGGGCA TCTACGAGCA CTCGCTGAAA CTGTGGGAGG GGCTGGAGGA GGATCTCGGC 
TACCCGATCC TGTTCAGCCG GCGCGGCGTG CTCAACCTCG CCCACAGCCT GCAGGACGTC 
CGGGAGGGCG TGCGCCGGGT CAACGCCAAC CGGCTCAACG GCGTCGACGC CGAGTGGCTG 
AGCCCCGAGG AGGTCAGGCG GGTCTGCCCG ATCGTCGACG TCTCCCAGGA CGTGCGCTAC 
CCGGTGCTGG GCGCGACCTA CCAGCCCCGG GCCGGGATCG CCAAGCACGA CAACGTCGCG 
TGGGGGTTCG CCCGCGCGGC CGCGGCGATG GGCGTCGACC TGATCGAGCA CTGCGAGGTC 
ACCGGGATCG ACGTCGCCGG CGGGCGGGTG CGGGCCGTAC GGACCACCCG GGGGCGCATC 
GCGGCGGGCA GGGTCGCGAT GTGCGCGGCC GGTCACTCCT CGGTCGTGGC CCGGATGGCG 
GGGCTGGACC TGCCGGTGCA GAGCCACCCC CTCCAGGCGC TGGTGTCGGA GCTGCTGGAA 
CCCGTGCACC CGACGGTGGT CATGTCCAAC GCCGTGCACG TCTACGTCAG CCAGGCGCAC 
AAGGGCGAGC TGGTCATGGG AGCGGGCATC GACGCCTGCA ACTCCTACCG GCAGCGCGGC 
GCCTTCCACG TCATCGAGCG GCAGATGGCC GCGGCGCTGG AGCTGTTCCC CGTCTTCGCG 
CGGGCACACG TGCTGCGGAC CTGGGGCGGG GTGGTGGACG TCACCCCCGA CGCCTCCCCG 
GTCGTGGGGC TCACCCCGGT CGAGGACCTC TACGTCAACT GCGGCTGGGG CACCGGCGGG 
TTCAAGGCCA CGCCGGGGGT CGGATGGTGC TACGCGCACA CGATCGCCCA CGGCGAGCCG 
CACCCGCTCA ACGCCCCCTT CTCCCTCGAA CGATTCACCA CCGGCGCGCT CGTGGACGAG 
CACGGCGCCG CCGCGGTGGC CCACTGA

Protein sequence

MSVHDAGPPE HPDRLWNSPE PAASYDVVIV GGGGHGLATA YYLARDHGIT NVAVLERGWL 
AGGNMARNTA IIRSNYLLDE SAGIYEHSLK LWEGLEEDLG YPILFSRRGV LNLAHSLQDV 
REGVRRVNAN RLNGVDAEWL SPEEVRRVCP IVDVSQDVRY PVLGATYQPR AGIAKHDNVA 
WGFARAAAAM GVDLIEHCEV TGIDVAGGRV RAVRTTRGRI AAGRVAMCAA GHSSVVARMA 
GLDLPVQSHP LQALVSELLE PVHPTVVMSN AVHVYVSQAH KGELVMGAGI DACNSYRQRG 
AFHVIERQMA AALELFPVFA RAHVLRTWGG VVDVTPDASP VVGLTPVEDL YVNCGWGTGG 
FKATPGVGWC YAHTIAHGEP HPLNAPFSLE RFTTGALVDE HGAAAVAH