Gene Sros_1645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1645
Symbol
ID	8664922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1757101
End bp	1758822
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	76%
IMG OID
Product	glycosyltransferase-like protein
Protein accession	YP_003337379
Protein GI	271963183
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.514144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCAC GGATCACCGG CAACGACTAC CGGAGCCTCA CCCCGCCCGA GCTCGGCGCC 
TGGACGCCGT CGCTGCGGGT CAGCGTGGTC GTGCCCGCCT ACGGCGGCCA GGACAAGCTC 
GACCTCGTGC TCGCGGGGCT GGCGGGGCAG ACCTATCCCG CCGGCCTGAC CGAGGTCATC 
GTGGTGGACA ACGGCAGCGA GCCGCCGCTG CGCCTGCCCG AGCTGAGGCC CGCGAGCACC 
CGGCTCATCG TCTGCCCCAC TCCCGGGCGG GCCCACGCCC GCAACGCGGG GCTCGGCGCC 
GCCACCGGTG ACGTGATCCA CTGGCTCGAC TCCGACGTGG TCCTGGACCG CCGGTCCGTC 
GAGGCGCACA TGCGCTGGCA CCACGCGGCG CCCTACCTCG TGGTGACCGG CTACCTGCGT 
TTCACCCCGG CGGAGCTGCC CGCCCCCCGG GAGGTGGCCG CGGCCGCCGA CCTGGCCGAG 
CTCTTCGAAC CGGCCGAGCC GCACGCCTGG CTGGTGGACC TCATCGAGCG GACCGACGGC 
CTCACCGACA ACCCGCACCG CGCGTTCAGC CTGCACGTGG GCGGCGCCAC CTCGGTCAAC 
GCCGCGCTGC TCGCCCAGGC CGGGCCGATG GACACCGAGC TCATCCTTGG CCAGGACACG 
GAGATGGGCT ACCGGCTGGC CCAGGCGGGC GCGGTCTTCG TGCCCGAGCC GCTGGCCCGC 
GCCTTCCACC TCGGTCCCAC CATGCGGATG CGCGACAAGG CGCCGATCGA CCGGGTCAGC 
CACGCCTTCG TCGCCGACCG GATCCCGAGT TATCGGTGGC TCCGCGCCCA TCCGGCCCGG 
CAGTGGAAGG TGCCCTACCT GGAGGTGGTC GTCGGGCCCG CCGGGCGGCC GGACCACGCC 
GGGGAGGGCG GGCGCGGGTA CGGCTACGAC GAGGTCCGCG CCACCGTGGA CGCCGTCCTC 
GCGGGCACCG TGCCCGACGT GGTGGTCACC GTCACCGGTC CCTGGGACCG CGTCCGGACC 
GAGGGCCGCG CGCCGTTGCG GAACCCGGAC CTGGACCTGG AGCTGATCCG CGGCCACTAC 
GCCCACGAGG GCCGGGTGCG GTTCGCCCTC GACGCCCCTC GGACGGTGCG GATGGCTCCG 
CCGTACCCGG CGGAGGGCGG CGAGGCGCCG GAGGCCGGGG CGGCCCCGCC GTACCGGCTG 
AGGCTGCCCG CCGGCTGGGT GCCGGGCGAG GACAGCCTCG CCCGCCTGCT CGACGTGGCC 
GGGGACGGGG GATACGGGCT GGTCTCGGCG CTGCTGGCCG AGGGGGCCGG CGAGGGGATC 
GTGGCGGCCA GGCTGGAGCG CACCGCCGCG TTCGCCCGTG CCGCGATCGT CCGGCGGGAG 
GGCGAGGACC TCGACGACGC GGTGGAGGAC ACCTCCGGGG TGCTCTGGGT GGACGGCGAG 
ACCTACGGGT TCCTGCCGGA GGCCCGGCCG ATCATCGGCC GCCGCGGCGC GTACCGGGCC 
AGGACGGAGG CGCAGGCCGA GATCGCCCGC CTCGCCAAGG AGAACGAGCG GCTGCGCGCC 
CAGGTGACCA GGTGGCGCGA CGAGGCGGGC CGCTGGCGCA AGAGCGCGGT CGAGCTGCGG 
CGCGAGGTCG GCGGTCTGCG CAAGGAGCTG GCCGCCGCCA GGAAGATCGT CCAGTACGGC 
CTGCTCTCGT CCGTCAAGCG GGCGATCATC CGCCGCCGGT GA

Protein sequence

MTARITGNDY RSLTPPELGA WTPSLRVSVV VPAYGGQDKL DLVLAGLAGQ TYPAGLTEVI 
VVDNGSEPPL RLPELRPAST RLIVCPTPGR AHARNAGLGA ATGDVIHWLD SDVVLDRRSV 
EAHMRWHHAA PYLVVTGYLR FTPAELPAPR EVAAAADLAE LFEPAEPHAW LVDLIERTDG 
LTDNPHRAFS LHVGGATSVN AALLAQAGPM DTELILGQDT EMGYRLAQAG AVFVPEPLAR 
AFHLGPTMRM RDKAPIDRVS HAFVADRIPS YRWLRAHPAR QWKVPYLEVV VGPAGRPDHA 
GEGGRGYGYD EVRATVDAVL AGTVPDVVVT VTGPWDRVRT EGRAPLRNPD LDLELIRGHY 
AHEGRVRFAL DAPRTVRMAP PYPAEGGEAP EAGAAPPYRL RLPAGWVPGE DSLARLLDVA 
GDGGYGLVSA LLAEGAGEGI VAARLERTAA FARAAIVRRE GEDLDDAVED TSGVLWVDGE 
TYGFLPEARP IIGRRGAYRA RTEAQAEIAR LAKENERLRA QVTRWRDEAG RWRKSAVELR 
REVGGLRKEL AAARKIVQYG LLSSVKRAII RRR