Gene Sros_1905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1905
Symbol
ID	8665183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2029718
End bp	2030926
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	74%
IMG OID
Product	glycosyltransferase
Protein accession	YP_003337636
Protein GI	271963440
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCATGT CAGCCGCGCC CGCGCTCGCC CCGGCCCCTC TCGCCACCCG GCCACGCCGG 
GTGCTGATCG GCACCGACAC CTACCCGCCC GACGTGAACG GCGCCGCCTA CTTCACCCAC 
CGGCTGGCCG GCGGCCTGGC CGAGCGGGGC AACGAGGTCC ACGTGGTCTG CGCCTCCGAC 
GAGGGGGCGG CCAGGACCGA GCACGTGAAC GGCGTGACCG TGCACCGGCT CCGCTCGGCG 
CCGGTGCTGG TGCATCCGAC CATGCGGATC TCGGTGCCCA CCCGGCTGGA CCGGCTCATG 
GCTGCCATCG CCCCGGACGT GGTCCACGTC CAGGGACACT TCGTGGTCGG CCGCGCCGCG 
ATCTCGGCCG CCCGGCGCGT GGGCGTCCCG GTTGTGGCGA CCAACCACTT CATGCCGGAC 
AACCTCTTCC AGTTCGCGCA CATCCCCGGT CCGCTCCGCG AGCGGGCCGG CGACCTCGCC 
TGGCGGGACT TCAGGCGCGT CTTCTCCCGG GCGGACCGGG TGACCACGCC GACCCGGATC 
GCCGCGGGAC TGCTCGCCGG GAAGGGTTTC ACCCGTTCGG TGGAGCCGGT CTCGTGCGGC 
ATCGACCTCA GCCGGTTCCG GCCGCACACC GGCCCCAAGG CGTGGGCGCG CGAGGCGTTC 
GGCCTGCCCG ACCGCGACAC CGTGCTGTTC GTCGGGCGGC TGGACGAGGA GAAGCGGCTG 
GACGAGCTCG TCCGCGCCCT GCCGTACATC CTCAACGGGA CCGACGCGCA GCTCGCGCTG 
GTCGGGACCG GGGGGCAGCG GGCGGCGCTG GAGAGGCTGG CGGCCCGGAT CGGGGTCGGT 
GACCGGGTGT TCCTCCTCGG GTTCGTCCCC GACGAGGCGC TTCCCCGGGC CTACGCCGCC 
GCGGACGTCT TCGCCATGCC CGGGGTCGCG GAGCTGCAGA GCATCGCCAC CCTGGAGGCC 
ATGGCCACCG GGCTGCCGGT GGTCGCCGCC GACGCGATGG CCCTCCCCCA CCTGGTACGG 
CCCGGCGAGA ACGGCCGGCT GTTCCGGCCG GGTGACGTCC AGGGGCTTGC CCGCCACCTC 
AACGACCTGC TCTGCGCGCC CGGCCTGCGC GGCGTGATGG GCGCGGCGAG CCGTGCGATC 
GCGCTGACCC ATGACCACCA GGCCTCCCTG GCCCGGTTCG AGACGATCTA CCAGGAGGTG 
GCCCGATGA

Protein sequence

MVMSAAPALA PAPLATRPRR VLIGTDTYPP DVNGAAYFTH RLAGGLAERG NEVHVVCASD 
EGAARTEHVN GVTVHRLRSA PVLVHPTMRI SVPTRLDRLM AAIAPDVVHV QGHFVVGRAA 
ISAARRVGVP VVATNHFMPD NLFQFAHIPG PLRERAGDLA WRDFRRVFSR ADRVTTPTRI 
AAGLLAGKGF TRSVEPVSCG IDLSRFRPHT GPKAWAREAF GLPDRDTVLF VGRLDEEKRL 
DELVRALPYI LNGTDAQLAL VGTGGQRAAL ERLAARIGVG DRVFLLGFVP DEALPRAYAA 
ADVFAMPGVA ELQSIATLEA MATGLPVVAA DAMALPHLVR PGENGRLFRP GDVQGLARHL 
NDLLCAPGLR GVMGAASRAI ALTHDHQASL ARFETIYQEV AR