Gene Sros_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3101
Symbol
ID	8666388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3382869
End bp	3384047
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	73%
IMG OID
Product	glycosyltransferase
Protein accession	YP_003338792
Protein GI	271964596
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.325178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTATCT CCTCCCAGAG GTGTGCCGTG AACATTGCAT TCGTCTCCTC CGACGCTCTC 
TCCGCCTCCC AGAGCCAGTC CGACCTCGCC GCGCAGCGCG CCCACCTTCT GGCCATCGCC 
CGCGAGCTGG GCCGGGAGCA CAAGGTCACG ATCTACACCC GCAGGCACTC CGACGCCGAC 
AAGCCCCGGG TCCGCATGTT CCAGGGGGTC ACGCTGGAGA ACCTGGCCGC CGGGCCCGCG 
GAGGACCTTC CCGAGGACAG CGTCCTCCCC TACCTGCCCG ACCTCGGCGA CCAGCTCATG 
CGCCGCTGGG GGCAGGACCG CCCGGACGTC ATCCACGCGC ACTCCTGGAC CGGTGGCCTG 
GCCGCCATCG CGGGGGCCGA CGGCCTGGGC GTGCCGTTCA CCCAGAGCTT CAGCAGCGAG 
CACAGCCGCG ACGCCAAGAA GGTCCGGGTG CAGCGCGCGA TCGGCCGCCG TGCCAGCGCG 
GTGATCGCCG GATGCGGGGA CGAGGAGTCC ACGCTGATCC GGCTGGGCGT GCCGCGCCGC 
AACATCTCCG TGATCCCCTG CGGCGTCGAC GTCGAGCGCT TCCGGCGTCA GGGCCCGGCC 
GCGGCCCGGG GCACCCGCCC CCGCCTGCTC CACGTCGGGC CGCTGACCCA GGACAAGGGC 
GTCTCCACCG CCATCCGCGC CCTGGAGGGC ATCCCCGACG CCGAGCTGCT CATCGCCGGC 
GGCCCGGACG TGGCGGGGCT GGCGCACGAC GCCGACGCGC ACCGCGTCAT GCTGCTGGCC 
AAGGAGGTCG GCGTGGAGGA CCGGGTCACC CTGCTCGGCC AGGTCCCGCA CACCTCGGTG 
CCCAAGCTGA TGCGCAGCGC CGACCTGGTC ATCTCGCTGC CGCACGAGAC CGCCACCGGT 
ATCGTCGCGC TGGAGGCCAT GGCGTGCGGC GTGCCCGTCA TCGCCTCGGC GGTGGGCGCC 
CACCTCGACT CCGTCGTGGA CGGGGTGACC GGCCTGCTGG TGCCGGCGGA CCGTCCCGCG 
CAGACCTCCC GCCTCATCCG GGAGCTGCTC GCCGACCCGA CCCGGCGTAC GGCGCTCGGT 
TTCGCCGGCG CCGACCGCGC CCGCTCCCGC TACTCCTGGG AGCGGATCAG CCAGGAGCTC 
GTCCAGGTCT ACGAGAACGC CCTCGCGACG CAGCACTGA

Protein sequence

MPISSQRCAV NIAFVSSDAL SASQSQSDLA AQRAHLLAIA RELGREHKVT IYTRRHSDAD 
KPRVRMFQGV TLENLAAGPA EDLPEDSVLP YLPDLGDQLM RRWGQDRPDV IHAHSWTGGL 
AAIAGADGLG VPFTQSFSSE HSRDAKKVRV QRAIGRRASA VIAGCGDEES TLIRLGVPRR 
NISVIPCGVD VERFRRQGPA AARGTRPRLL HVGPLTQDKG VSTAIRALEG IPDAELLIAG 
GPDVAGLAHD ADAHRVMLLA KEVGVEDRVT LLGQVPHTSV PKLMRSADLV ISLPHETATG 
IVALEAMACG VPVIASAVGA HLDSVVDGVT GLLVPADRPA QTSRLIRELL ADPTRRTALG 
FAGADRARSR YSWERISQEL VQVYENALAT QH