Gene Sros_9217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9217
Symbol
ID	8672564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	10163713
End bp	10164864
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	69%
IMG OID
Product	putative glycosyl transferase, group 1
Protein accession	YP_003344578
Protein GI	271970382
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCT CCTTCCTGAT CCTCAACGCC TACGGCATGG GGGGGACGAT CCGGGCCACC 
TTCGACCTCG CCACCGAGAT GGCCGAGCGG CACGACGTCG AGGTGATCAG CGTCTTCCAG 
CACACCGACC TGCCCTTCCT GCCGCTGGGA TCCAAGGTCA GGCTGCGTTC GCTGGTGGAC 
CTGCGGGAGG GGGCCAGGGT CCGCTGGCCG TACACGAAAA AGGCGGAGCG GCTGGGCGAG 
CAGCCGAGCG AGCTGATCCA CCCCGAGGAG CGCGCCTACG CCTCCTTCAG CGCCTGGAGC 
GACGACGTGC TCCGGCGCGA GCTGCGGCGG CTCCGCACCG ACGTGCTGAT CACCACCCGC 
GCCGGGCTGA ACATCATGGC CGCCCGCTTC GCCCGCAGGC GGGTCGTCAC GATCGCCCAG 
GAACACCTGC ACTTCGAGGC CCACCAGCCC GGCATCTTCG AGGAGATCCG GCAGTGGTAC 
CCGAAGCTGG ACGCGATCGT CACCCTCACC GAGGCCGACG AGCAGGACTA CCGGACCATG 
CTCGACGGGG CGCGGACGCG GGTCTACACC ATCGGCAACG GGCTGGCCGG AGGGCCGCGC 
CCCCGCTCCA GGCAGGACAA CAGGATCGTG CTGGCCGCCG GGCGGCTGGT GCCGGTCAAG 
GGGTACGACC GGCTGCTGAA GGCGTTCGCC CAGGTGGTCC GGGAGCGCCC GGACTGGAAA 
CTGCGGATCT ACGGCGAGGG CCGGATCAGC GACAAGCTGG TCAAGCTGGC CGTCAAGCTG 
CGCCTGCACA ACAACGTCAC GTTCATGGGC CCGACCGGCG ACATCGAGGG CGAGCTGGCA 
AAGGCATCCA TCCACGCGGT CAGCTCCCGG TTCGAGGGCT TCGGCATGAC CATCATCGAG 
GCGTTCGCGT GCGGGGTGCC GGTGGTCAGC TTCGACTGTC CCCGAGGACC TCGCGAGATC 
ATCACCCCCG GTCACGACGG GGTGCTGGTC CCGCCCGACG ACGTGGACGC CCTGGCCGGC 
GGGCTGCTCA AGATGATCGA CGACGAGGAG GGCCGTCACC GGATGGCGGT CAACGCGCTG 
GAGACGGCCA GGCGCTACGA CATCTCCATG ATCGTGGAAC GGTGGGAGAA GTCCTTCGCC 
GAGCTCGTGT GA

Protein sequence

MKISFLILNA YGMGGTIRAT FDLATEMAER HDVEVISVFQ HTDLPFLPLG SKVRLRSLVD 
LREGARVRWP YTKKAERLGE QPSELIHPEE RAYASFSAWS DDVLRRELRR LRTDVLITTR 
AGLNIMAARF ARRRVVTIAQ EHLHFEAHQP GIFEEIRQWY PKLDAIVTLT EADEQDYRTM 
LDGARTRVYT IGNGLAGGPR PRSRQDNRIV LAAGRLVPVK GYDRLLKAFA QVVRERPDWK 
LRIYGEGRIS DKLVKLAVKL RLHNNVTFMG PTGDIEGELA KASIHAVSSR FEGFGMTIIE 
AFACGVPVVS FDCPRGPREI ITPGHDGVLV PPDDVDALAG GLLKMIDDEE GRHRMAVNAL 
ETARRYDISM IVERWEKSFA ELV