Gene Sros_1361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1361
Symbol
ID	8664636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1410314
End bp	1411435
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	74%
IMG OID
Product	Glycosyltransferase-like protein
Protein accession	YP_003337099
Protein GI	271962903
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTAT GTGTCGGGAC GATTGTCCAT CACCCCGAAG ACGCCCGGAT CATGCATCGG 
CAGATCCGGG CGCTCCTCGA CGCGGGGCAC GAGATCACCT ATGTCGCGCC CTTCACCGAC 
TGCAACGTCA CGCCCGATCC CCGGATCCGG GCCGTCGACG TCCCCCGCGC GCTGGGCCGC 
CACCGTAGAC GTGCCCTGAA GGCCGCCCGG GGGGCCCTGA AGCGCGGAGC CGAGGGCGCC 
GACCTTCTGG TCGTCCATGA CATCGAGCTG CTTCTCCGGC TGCCCAGGCG CCGCCCCGTG 
ACCGTCTGGG ACGTCCACGA GGACACGGCC GCCGCCCTGG AGGCCAAGAC GTATCTCCCG 
GAGCTCCTGC GCCGGACCCT GCCGTCGCTG ATCCGCCGGG TCGAGGCCCG CGCGGAGGAC 
CGGCTGCACC TCGTCCTGGC CGAGGAGGCC TACCGGGAGC GGTTCTCCGG GTCCCACCCG 
GTGGTGCCCA ACACCACCTA CGTGCCCCAT CGGCCGCCCC CGCCGCCCGG CCGGAACCGG 
GTGGTCTACG TGGGCCAGCT GTCCCGGGCC AGGGGCGCGG CGGAGCTGGT CGAGCTGGCC 
CGGCGGCTGC TCCCCCACGG GATCAGGACG GACCTGGTGG GCGCCGCCGA CGCCGAGATC 
AGGCCCATGC TGCGGGACGC GCAGCGACAG GGCCTGCTCG ACTGGTACGG CTACGTGCCC 
AACCAGCACG CGCTGCGGAT GGCCGAAGGG GCGATCGCCG GGCTGTCACT CCTGCACGAC 
GTGCCCAACT ACCGGCAGTC GATGCCGACC AAGGTCGTCG AGTACATGTC CCGCGGGCTC 
CCGGTGGTCA CCACGCCGCT CCCGGCCGCC GCTGCCCTGG TCGGCCGGAC CGGCTGCGGG 
GTGGTCACGC CCTTCGGGGA CGTGGACGCG GTGCTGGGCG CCGTACTGGC GCTGCGGGAC 
GATCCCGGGG GAGCCGCGGC GATGGGCGCA CGCGGCTACG AGGAGGCGCT GCGCCACTAC 
GACTGGCCCG CCCACGCGGG CGAGTTCGTG GGGCTGCTGG AGGGGTGGGC GACGGCGAGC 
GCCGCCCCCG CGCGCGCCCA CCGCCGTCCC CTCGTGGTCT GA

Protein sequence

MRVCVGTIVH HPEDARIMHR QIRALLDAGH EITYVAPFTD CNVTPDPRIR AVDVPRALGR 
HRRRALKAAR GALKRGAEGA DLLVVHDIEL LLRLPRRRPV TVWDVHEDTA AALEAKTYLP 
ELLRRTLPSL IRRVEARAED RLHLVLAEEA YRERFSGSHP VVPNTTYVPH RPPPPPGRNR 
VVYVGQLSRA RGAAELVELA RRLLPHGIRT DLVGAADAEI RPMLRDAQRQ GLLDWYGYVP 
NQHALRMAEG AIAGLSLLHD VPNYRQSMPT KVVEYMSRGL PVVTTPLPAA AALVGRTGCG 
VVTPFGDVDA VLGAVLALRD DPGGAAAMGA RGYEEALRHY DWPAHAGEFV GLLEGWATAS 
AAPARAHRRP LVV