Gene Sros_9234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9234
Symbol
ID	8672582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10183721
End bp	10184887
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	73%
IMG OID
Product	putative glycosyl transferase, group 1
Protein accession	YP_003344595
Protein GI	271970399
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCC GGTACATGCT CCTGCACGCC TACGGGATGG GCGGCACGAT CCGCACCGTG 
GTCAACCAGG CCAACGCGAT GGCCGCCGCC GGGCACGACG TCGAGATCGT CAGCGCGGTA 
CGGCGCCGCG ACGCCCCCCG GTTCCGCGTC GACCCGCGCG TCGAGGTCAC CGCGCTGACG 
GACCAGCGCG GCGGTGTGCG CGCCGACTCG CTGGGGCGCA GGGTCTGGCG GCGGGTCCGC 
GGGAAGATCG TGCCCCACGG CGAGTTCGCG GCGTCCTACT TCACCGAGCG GGTGGAGAGG 
GCCGTCATCG ACTACGTCTC CGCGCTGGAG GACGGCATCC TGGTCACCAC CCGCCCGGCG 
CTGAACCTCA TCTCCGCCCG CCGTACTCCC GCGAGCGTGG TGCGGATCGC GCAGGAGCAC 
ATGAACCTGG CCACCCACCC CGAAAGCGTC CGCAGGGAGA TCGCCCGCCA CTACGGCCGG 
CTGGACGCGG TCGCGGTGCT CACCGGGACC GACCGCAGGG ACTACCAGGC GCTGCTGCCC 
GGCACCCCGG TCGTGCGGAT CCCGAACGCG GTCCACCCCC TCGACCAGGC GCCGTCGCGG 
CAGGAGAACC GGCTCGTGAT CGCCGCCGGG CGGCTCGTCG CCCAGAAGGG GTTCGACCTG 
CTCATCCCGG CGTTCAAGCA GGTCGTGCAC CACCATCCGG ACTGGCGGCT GCGCATCTAT 
GGCACCGGCC CGAAGAAGGC CGCGCTGCGC GCTCTCGTCA AGGAGCACCG GCTCGCCGAC 
AACGTCACCC TGATGGGGCG CAGTGACCGG CTGGACGAGG AGCTGGCCCA TGCCTCGCTG 
TACGTGCTCA GCTCCCGGTT CGAGGGGCTG CCGATGGTGA TGATCGAGGC GATGTCGCAC 
GCGCTGCCGG TCGTCGCCTT CGACTGCCCG ACCGGTCCGC GCGACGTCAT CACCGACGGG 
ATCGACGGGC TGCTCGTGCC GCCCCAGGAC GTCGACGCGC TGGCGGCGGC GGTCAGCCGC 
CTCATCGCCG ACCGGGAGCT GCGGCGGCGG ATGGGCGCCG CGGCCGTACG GACCGCGCGG 
GACTACGCTC CCGAGGCCGT CACCCCGCTG TGGGAGAGGC TGTTCACCGA ACTGCTGCGG 
GCCGAGCCCC CCGCCGCGGA GCGCTGA

Protein sequence

MKIRYMLLHA YGMGGTIRTV VNQANAMAAA GHDVEIVSAV RRRDAPRFRV DPRVEVTALT 
DQRGGVRADS LGRRVWRRVR GKIVPHGEFA ASYFTERVER AVIDYVSALE DGILVTTRPA 
LNLISARRTP ASVVRIAQEH MNLATHPESV RREIARHYGR LDAVAVLTGT DRRDYQALLP 
GTPVVRIPNA VHPLDQAPSR QENRLVIAAG RLVAQKGFDL LIPAFKQVVH HHPDWRLRIY 
GTGPKKAALR ALVKEHRLAD NVTLMGRSDR LDEELAHASL YVLSSRFEGL PMVMIEAMSH 
ALPVVAFDCP TGPRDVITDG IDGLLVPPQD VDALAAAVSR LIADRELRRR MGAAAVRTAR 
DYAPEAVTPL WERLFTELLR AEPPAAER