Gene Sros_8934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8934
Symbol
ID	8672272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	9868512
End bp	9870143
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	66%
IMG OID
Product	ABC-type oligopeptide transport system periplasmic component-like protein
Protein accession	YP_003344309
Protein GI	271970113
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTTA CTAAGGGCGC ACGGATCACC GCCGGCACCG CGCTGCTCGC TCTGGGGCTG 
GCCGCGTGCG GCAGCCAGGG CTCCACGGGC GGTGGGACGG CCTCCGCCGA CCAGCCCGTG 
CGCATGGAGC TCGGCGAGCC CCAGAAGCTC TTCTACCCCG GTGACACCAC CGAGTCCGAG 
GGCTCCGAGG TGCTGGCCGC CGTCTTCGCT CCGCTGGTGA GCTACGACGA GAACAAGCAG 
GTCGTCAACG ACGTCGCCGA GTCGATCAAG ACGACCGACA ACAAGACGTG GACGATTGAG 
CTCAAGCCGG GCTACACCTG GCACAACGAC GAGCCGCTGG TCGCGCAGAA CTACGTCGAC 
GCGTGGAACT TCGCCGCCAA CCAGGACAAC GCCCAGGGTG CCAACGGCTT CTTCAGCCGC 
GTCGAGGGCT GGGCCGACCT GAACCCGGGC GAGGGCAAGA CCGTCTCCAC CAAGGAGATG 
AAGGGCCTCA AGGCCGTCGG CGAGAGCACG CTCAAGGTCA CCCTGACCAA GCCGTTCTCG 
CAGTTCAAGA CGATGCTGGG CTACACGTCG TTCTACCCGC TGCCCAAGGC CGCCTTCGGT 
GAGGACGGCA AGGTCACCGA GGCGTACGCC AAGCAGCCGA TCGGGCAGGG CTACTTCAAG 
TTCGACAAGC CCTACAACAA GGGCACCGAC CAGGCGATCG ACCTGACCCG GTACGACAAG 
TTCCCCGGGG ACAAGCCGAA GTTCGACAAG CTCCAGTTCA AGCTCTACGC CAGCGCCGAG 
ACCGCGTTCA ACGACCTGCG CGCGGGCAAC CTGGACGTCC ACGACTCGCT GCCCCCCTCG 
GCGATCGCCA GCGCCAAGGC CGAGCTCGGC GAGCGCTACA TGGACGAGGC CGACGCCGGC 
GTCGGCTACA TCGGCTTCCC GATGCAGTAC AACAAGACCT ACGCGAACGT GAAGGTCCGC 
GAGGCCATCT CCCTGGCCAT CGACCGCAAG ACGATCGCCG AGACGGTCTT CTCGGGCACC 
CGCGCCCCGG CCGACGACTT CATCAACCCG CTGCTCGACG GCTACCGTCC GGGCGCCTGC 
GCGGTCTGCA CCTACGACCC GGCCAAGGCC AAGACGCAGT ACGCCGACAA CGGTGGCCCG 
AAGACGCTGG AGCTGGGCTA CAACTCCGAC GGCCCGCACA AGGAGTGGAT CGAGGCGGTC 
GCCAACAACC TCCGCGCCAA CCTCGGCGTC CAGGTCACGG TGAAGCCGTT CGAGAAGTTC 
GCCTCGATCC TCGACGAGCT CGACAAGAAG ACCTACGGCG GCATGTTCCG CATGGGCTGG 
GCGATCGACT ACCCGTCCGC GGAGAACTAC CTGACCCCGG TCTTCTCCAC CGTCGCGATC 
AAGACCGGCT CCAACTACGC CGGCTGGTCC AACAAGGCGT TCGACGACCT CCTCGCCAAG 
GGCGACAGCG CCGCGACGCA GGCGCAGGGC CTGAAGTACT ACCAGCAGGC CGACGACATC 
CTGATCAAGG AACTGCCGTA CATCCCGGTG TACTTCTACC GGACGAACGC CGCGTTCTCC 
CAGCATGTCA AGGGCATCAA GATCAACCTC CTCAACCAGG TCGAGTGGGC CCAGGTGGAG 
AAGGTCGCCT GA

Protein sequence

MRVTKGARIT AGTALLALGL AACGSQGSTG GGTASADQPV RMELGEPQKL FYPGDTTESE 
GSEVLAAVFA PLVSYDENKQ VVNDVAESIK TTDNKTWTIE LKPGYTWHND EPLVAQNYVD 
AWNFAANQDN AQGANGFFSR VEGWADLNPG EGKTVSTKEM KGLKAVGEST LKVTLTKPFS 
QFKTMLGYTS FYPLPKAAFG EDGKVTEAYA KQPIGQGYFK FDKPYNKGTD QAIDLTRYDK 
FPGDKPKFDK LQFKLYASAE TAFNDLRAGN LDVHDSLPPS AIASAKAELG ERYMDEADAG 
VGYIGFPMQY NKTYANVKVR EAISLAIDRK TIAETVFSGT RAPADDFINP LLDGYRPGAC 
AVCTYDPAKA KTQYADNGGP KTLELGYNSD GPHKEWIEAV ANNLRANLGV QVTVKPFEKF 
ASILDELDKK TYGGMFRMGW AIDYPSAENY LTPVFSTVAI KTGSNYAGWS NKAFDDLLAK 
GDSAATQAQG LKYYQQADDI LIKELPYIPV YFYRTNAAFS QHVKGIKINL LNQVEWAQVE 
KVA