Gene Sros_5179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5179
Symbol
ID	8668473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5693055
End bp	5694296
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	75%
IMG OID
Product	glycosyl transferase
Protein accession	YP_003340698
Protein GI	271966502
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000882934
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGTGTGT TGTTGTCGAC GTATGGGTCG CGTGGGGACG TCGAACCGCT GGTGGGACTC 
GCGGTGCAAT TGCGGGCGCT CGGCGCGGAG GTGCGGGTGT GCGCTCCGCC GGACGAGGAC 
TTCGCGGAGC GGCTGGCCGG TGTCGGCGTG CCGCTGATGC CGGTCGGCCA GTCGGCGCGC 
GCGCTGACGA CCGCGGCGCC GCCGCCGTCG CCGGCGAACC TGCCCCAGCG CGCGGCCGAG 
TTGATCGCCG GCCAGTTCGA CGTGGTCACC GCGGCGGCCG AGGGGTGTGA CGTGCTGGTG 
GCGACCGGCG CGATGCCGGC CGCGGCCGGC GCGCGGTCGG TGGCCGAGAA ACTGGGCATC 
CGCTCCGTGT CCGTGACCTT CCAGCAGCTC ACCCTGCCGT CGCCGCACCA CCCGCCGCTG 
GCGTATCCGG GCCGGCCGTT CCCGCCGGAC GTGACCGACA ACCGGGTGCT GTGGGACCTG 
GACGCCCAGA GCATCAACGC GCTGTTCGGT GCGGCGCTCA ACACGAACCG GGCGTCGATC 
GGCCTGCCCC CGGTGGACAA CGTCCGCGAC TACGTCATCG GCGACCGGCC GTGGCTGGCG 
ACGGACCCGA CCCTGGACCC GTGGCAGGAG CCGGCGGACC TCGACGTCGT GCAGACCGGC 
GCGTGGATCC TGCCCGACGT TCGCCCACTC CCGGCCGAGC TGACGGCGTT CCTGGACGCC 
GGCACACCAC CGGTGTACGT GGGCTTCGGC AGCATGCCCA TGAGCGCCTC GACGGACGCC 
GCCCGGGTGG CCATCGAGGC GGTCCGCGCG CAGGGCCGCC GCGCGCTCGT CGGGCGCGGC 
TGGGCCGACC TGGCCCTGAT CGACGACCGG GACGACTGCT TCACCGTCGG CGAGGTCAAC 
CAGCAGGCGC TGTTCGGCCG GGTGGCCGCC GTCGTGCACC ACGGCGGCGC GGGCACGACG 
ACGACGGCCG CCCGGGCCGG CGCTCCTCAG GTGGTGGTAC CCCAGGTGGC GGACCAGCCG 
TACTGGGCCG GACGGGTGGC CGGCCTGGGC ATCGGCGCGG CACACGACGG TCCGGCTCCG 
ACCTTCGAGT CCCTGTCAGC CGCGCTCAGG ACCTCCCTGG CCCCCGAGAC CCGCGCGCGA 
GCGGCCGCCG TGGCCGGCAC GGTCCGCACC GACGGGGCGA CGGTGGCCGC GAAGCTGCTG 
CTCGACGCGG TCAGCCGGGA GAGGCCGCCC GGGTCCGCGT GA

Protein sequence

MRVLLSTYGS RGDVEPLVGL AVQLRALGAE VRVCAPPDED FAERLAGVGV PLMPVGQSAR 
ALTTAAPPPS PANLPQRAAE LIAGQFDVVT AAAEGCDVLV ATGAMPAAAG ARSVAEKLGI 
RSVSVTFQQL TLPSPHHPPL AYPGRPFPPD VTDNRVLWDL DAQSINALFG AALNTNRASI 
GLPPVDNVRD YVIGDRPWLA TDPTLDPWQE PADLDVVQTG AWILPDVRPL PAELTAFLDA 
GTPPVYVGFG SMPMSASTDA ARVAIEAVRA QGRRALVGRG WADLALIDDR DDCFTVGEVN 
QQALFGRVAA VVHHGGAGTT TTAARAGAPQ VVVPQVADQP YWAGRVAGLG IGAAHDGPAP 
TFESLSAALR TSLAPETRAR AAAVAGTVRT DGATVAAKLL LDAVSRERPP GSA