Gene Sros_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1938
Symbol
ID	8665220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2072994
End bp	2074457
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	69%
IMG OID
Product	Exopolysaccharide biosynthesis protein related to N-acetylglucosamine-1-phosphodiester alpha-N- acetylglucosaminidase-like protein
Protein accession	YP_003337669
Protein GI	271963473
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGAC GTATCATCGT CGGGCTTTCA GCCATAGCAC TCACCATCAC GGCGATTCCC 
GCACAAGCCG ACCGCACCGG CGTGACCTTT CCCACCTCGG CGTTCCCACT CGGCCAGAGC 
GGGACACCGA TCAAGAACCA GCGCAGCGTG GCCCCCGGAG TCGACCTCTT CAGCGTGATG 
TCCGGCACGT CCACCCAGGG GTGGACCGTG ACGGTGCTGA TGCCCAACGG GCACGACGAC 
GGCAAGCTGA CCACCGCCCA GGCGAAGGCG GAGGAGGTCA CGGCGGCGGG ATTCACCCCC 
AGCGTGCAGA AGATCGTGCA GCCCGCCGCC GCGGACGCCC CGGCCGTGGA GCGCTACCTC 
GTCCGCGTCG GCCTGTGGAC GTTCAAGGAG CGCGCCAAGG CCGACAAGGT GGTCAAGGAG 
CTCAAGGAGT TCGACATCCG GGCCAAGACC GACTACCTCG GTGACGACGG CCTGGAGACC 
ACCGGCCCCT GGGACATGCG CGTGCTCATG GTGGACCCGC GCGCCTTCCG GGGGTCCTTC 
AAGACCAGCG TCGGGACCAG TGTCGCCAAG CGCGAGACCA CCACTTCGAT GTCCAAGCTG 
ACCAAGGCCA TCGCCGGCGT CAACGGCGGA TTCTTCAACA TCCACACGCC CAAAGCACTC 
CAGGGCGACC CGATGGGCAT CTCGGTGGTG GGTGGCAGGC TGCTCAGCGA GGCGGTGCCC 
GGCCGCAGCG GCCTGGTCAT CAGCGGTCGC AAGGTCCGGA TCACCGAGCT GAAGACGGTG 
ATCACCGCGA TCCCCGCCGA CGGGGCGAAG ACCGAGATCA AGGGCATCAA CCGGGCCGCC 
GGAGCGGACG AGCTCGTGCT CTACACCGAG GAGTTCGGCA CCAAGACGGC GGCCGACGGC 
GGCGCCGAGA TCGTGGTCGA CGCCCAGGGG AGGATCGTCA AGGCCCGCGC GGCCGGCGGC 
GTCGTCCCAC GCGGCACCTA CGTGCTGCAC GGCACCGGCA TCATGGCGAC CTGGCTCCTG 
GAGCACGCGC AGGAGACCTC CGTCATGAAG CTGGACACCA AGGTCATCGA CCTGCGGACG 
GAACGGGCCG TGCCGCTCAC CCCCGAGACG CACATCATGG GTGGCGGCGT CGGGCTCCTC 
AGGAACGGCC GGGTGCGGAT CAGCGCCAAG GCCGACGGGC ACGCGTCGGT CGTCATGATG 
CTCCGCCGCC ACCCGCGCAC GATGGTCGGC GTCACGAAGT CCGGCGGCCT GATCCTGGCG 
ACGGTGGACG GCCGCAACCC GGGTGTCACC GTGGGTGCCT CCATGGTGGA GGCGGCTCAG 
CTGATGCGCT GGCTGGGCGC CAAGCAGGCC ATCAACTTCG ACGGTGGCGG CTCGACCGCG 
ATGGTCGTCG GCCACAAGGT GATCAACCGG CCCTCCGACG GCAGCGAGCG GACCGTGGGC 
GACGGCCTGT TCATCACCCC CTGA

Protein sequence

MSRRIIVGLS AIALTITAIP AQADRTGVTF PTSAFPLGQS GTPIKNQRSV APGVDLFSVM 
SGTSTQGWTV TVLMPNGHDD GKLTTAQAKA EEVTAAGFTP SVQKIVQPAA ADAPAVERYL 
VRVGLWTFKE RAKADKVVKE LKEFDIRAKT DYLGDDGLET TGPWDMRVLM VDPRAFRGSF 
KTSVGTSVAK RETTTSMSKL TKAIAGVNGG FFNIHTPKAL QGDPMGISVV GGRLLSEAVP 
GRSGLVISGR KVRITELKTV ITAIPADGAK TEIKGINRAA GADELVLYTE EFGTKTAADG 
GAEIVVDAQG RIVKARAAGG VVPRGTYVLH GTGIMATWLL EHAQETSVMK LDTKVIDLRT 
ERAVPLTPET HIMGGGVGLL RNGRVRISAK ADGHASVVMM LRRHPRTMVG VTKSGGLILA 
TVDGRNPGVT VGASMVEAAQ LMRWLGAKQA INFDGGGSTA MVVGHKVINR PSDGSERTVG 
DGLFITP