Gene Sros_1648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1648
Symbol
ID	8664925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1761107
End bp	1762723
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	75%
IMG OID
Product	glycosyltransferase-like protein
Protein accession	YP_003337382
Protein GI	271963186
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.323978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATG GAGCGGGGAC CGACCTGCCC CTGATCCGGC ACAACGACTA CTCCCCCCTG 
GTCCCTCCCG CCCTCGGCGA ATGGGATCCG GCGCTCCCGG TAAGCGTGAT CATCCCCGCG 
CACGGCGGCC AGCACAGGCT CGACCTGACC CTCGCCGCCC TGGCGGCGCA GACCTACCCC 
GGTCACCTCA TGGAAGTGAT CGTGGTGGAC GACGGCAGCG ACCCGCCCCT GCGGCTGCCG 
GAGATCGCTC CGCCGGGCAC CAGGATCGTC GCCGCCGACC CCGGGCGCTG GGGCATCGCG 
CACGCGGTGA ACACCGGGGC CGCCCTCGCC GAGGGCCGGA TCATCCAGCG CCTGGACGCC 
GACATGGTCG TCTGCCGCGA GCACATCGAG GCACTGGCCC GCTGGCACCA CCTGGCCGGC 
TACCTGGTCG CCATCGGCGC GAAGAAGTTC GTCGAGGAGC CCGAGCTCTC CCCGGCCCAC 
CTGTACGACG GCGTGCGCAC GGGCCCGCTG GAGGCCGTCT TCGACCTGTC GGAGGCGCTG 
CCCAGCTCCA CCGAGCAGAC CATCTCCCGG ACCGACGGCC TGCGGACCAG CCGCAACCCC 
TACCACGTGT GCACCGGGCC GACGGTGTCG ATGCGGCGGG AGACCTTCCA CGCCGTCGGC 
GGGATCGATC CCGACGTGCT CAGGGGCGAG GACACCGAGT TCGCCTACCG GCTGGCCGCG 
CACGGGGCGG TCTTCGTCCC CGACATGGCC GCCCAAGCCG TGCACCTGGG ACTTCCCGCG 
CAGCGCCGTG ACCGTGACCG GGCGGTCCGC GCGGTCGGCC CCTACCTCGC CCACCGCGTT 
CCGCTCCGCC GTGACCTGCG CAAGGACCGG GGCCGGCGGT GGCTGGTGCC GTACGTGGAG 
GTGGTGCTCC ACGTCGACGG CGACGAAAGG CAGGTGCGCG ACGCGGTGAG CGCGGCGCTG 
GAGGGGTCGG TGACCGACGT GCGGGTCACC CTGGTCGCCC CCTGGTCCCG GCTGTCCCCG 
GGCCGCCGCG CGGTGCTCGG CGACCCCTCC TTCGAGCTGC GGCTGCTGCG CGAGCACTTC 
GCCCACGACG AGCGGGTACG GCGGGCCGAC GAGGTCTCCC CCACCCCCGC GCCGATCCCC 
TTCCGCTACA CCGGCCCGAT CTCGGTCCCG CTGGGGCACG GCTCGCTGGA GCGGATGATC 
GCCGCGCTCC AGGACGACCG GTCCGGCATG CTCGTCGTCG ACCTCGGCGA CGACGGTACG 
GCGACGCTGG AGCGGACCGA GGCGCTGGGC CGGGCACTCC TGCTGGGCGC GGACGACGTC 
CCCGCCTCGA TCAAGGCCAC CCACGGCGTG CGGCACGGCG ACCGGGCGGA GTTCTGGCCG 
GTCCCGGCCG CTCCGGCCGC TCCCGCCCGG AAGCCCGCGG GGGCTTCCGC GGAGAAGGCG 
GAGAAGTCCG CGCAGGCCGC GCCCGGGAGG CCCGCGCAGG CTCCCCCGGA GAAGCCGGCC 
TGGAATCCGC CGGAACAGCC CACGGCGGCT CCGTCCCGCG GGGACCGGCC CCCGGCGCCC 
GCGCGGAAGC CGGAGTCCCG GCTCTCCAGG CTCCGTTCGG CGATCCGGAG GGGCTGA

Protein sequence

MTDGAGTDLP LIRHNDYSPL VPPALGEWDP ALPVSVIIPA HGGQHRLDLT LAALAAQTYP 
GHLMEVIVVD DGSDPPLRLP EIAPPGTRIV AADPGRWGIA HAVNTGAALA EGRIIQRLDA 
DMVVCREHIE ALARWHHLAG YLVAIGAKKF VEEPELSPAH LYDGVRTGPL EAVFDLSEAL 
PSSTEQTISR TDGLRTSRNP YHVCTGPTVS MRRETFHAVG GIDPDVLRGE DTEFAYRLAA 
HGAVFVPDMA AQAVHLGLPA QRRDRDRAVR AVGPYLAHRV PLRRDLRKDR GRRWLVPYVE 
VVLHVDGDER QVRDAVSAAL EGSVTDVRVT LVAPWSRLSP GRRAVLGDPS FELRLLREHF 
AHDERVRRAD EVSPTPAPIP FRYTGPISVP LGHGSLERMI AALQDDRSGM LVVDLGDDGT 
ATLERTEALG RALLLGADDV PASIKATHGV RHGDRAEFWP VPAAPAAPAR KPAGASAEKA 
EKSAQAAPGR PAQAPPEKPA WNPPEQPTAA PSRGDRPPAP ARKPESRLSR LRSAIRRG