Gene Sros_7939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7939
Symbol
ID	8671264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8750591
End bp	8751877
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	69%
IMG OID
Product	ABC transporter (substrate-binding protein)
Protein accession	YP_003343338
Protein GI	271969142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.50295
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.560439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGAC GGTGGATGGC GGCCGTCGCG GTCACCGTGG CGGGCCTGCT CACCCTGACG 
GCCTGCGGCG ACGGCGGCGG CGCCGCGCAA ACCCCGCAGG CCGGCGGAGA GAAGAAGGTT 
GAGGTCTTCT CCTGGTGGAC GGGACCGGGC GAGGCCGACG GCCTGAAGGC CATGAAAGAG 
ATCTTCGAGA AGCAGAACCC CGGCCTGACG TTCTTCGACG CGGCCGTGGC GGGCGGTTCC 
GGCGACAAGG CGCGCGCCCT GCTGGCCACC AAGCTGCAGG CCGACACCCC GCCGGACACC 
TTCCAGGGGC ACGCGGGCGC CGAGCTGCAG GGCTACATCA AGGCCGGTGA CCTGGAGCCG 
GTCAACTCCC TCTACGACGA GCTCAAGCTG AAGGACGTCT TCCCGCAGCA GCTCGTCGAC 
CAGATCAGCG TGCAGGGCCA GATCTACTCG GTCCCGGTGA ACATCCACCG CTCCAACGTG 
ATGTGGTTCA ACCCCGCCGT GCTCAAGGAG GCGGGCGTCA CCGAGGTGCC CAAGACGATC 
GAGGAGTTCA CCGCCGCCCT GGAGAAGGTC AAGAAGACGG GCAAGATCCC GCTCGCGATC 
GGCTCCGAGT GGACGATGGT GCACCTGCTG GAGAGCGTGC TGCTCGGCTC GCTCGGCACC 
GAGGCCTACA ACCAGCTCTG GACCGCGGGG TCCGACTGGT CGGGTCCGGC GATGACCAAG 
GCGCTCAACG ACTTCAAGAC GGTCCTGTCC TACGCCGGGG ACCCGGCCGA CGACTGGCAG 
CCCGCGGCCA AGCAGGTCGC CGACGGCCAG GCCGCGTTCA CGATCATGGG CGACTGGGCG 
TACGGCTACT TCCACAACCC GCCGGACGGC GGCCTGGGCA AGAAGTCCAA GACCGACTTC 
GACTGGGCGC CCTCGCCCGG CACCGGCGGC ACCTTCATGT GGCTGTCGGA CAGCTTCACC 
CTGCCCAAGG GCGCGCCGAA CCGCGCCGGG GCGGTGGCCT GGCTGAAGGT GGCCGCGAGC 
AAGGAGGGCC AGGACGCCTT CAACCCCAAG AAGGGCTCCA TCCCGGCCCG CAAGGACGCC 
GACACCTCCC TCTACACCGA CTACCTCGCC GACGCGCTGA AGGACTGGGG GAGCAACAAG 
CTCGCCGGGT CCATCCAGCA CGGCGTCACC GTCAACGACG CCTGGCGGGT CTCGATCAAC 
GAGGCGGTCG GCCTCTTCCA CACCGACAAG GACGTGGCCG CGCTCCAGGC CGCGCTGGCC 
GAGGCCGCCA AGAACTCGGG TCAGTGA

Protein sequence

MRRRWMAAVA VTVAGLLTLT ACGDGGGAAQ TPQAGGEKKV EVFSWWTGPG EADGLKAMKE 
IFEKQNPGLT FFDAAVAGGS GDKARALLAT KLQADTPPDT FQGHAGAELQ GYIKAGDLEP 
VNSLYDELKL KDVFPQQLVD QISVQGQIYS VPVNIHRSNV MWFNPAVLKE AGVTEVPKTI 
EEFTAALEKV KKTGKIPLAI GSEWTMVHLL ESVLLGSLGT EAYNQLWTAG SDWSGPAMTK 
ALNDFKTVLS YAGDPADDWQ PAAKQVADGQ AAFTIMGDWA YGYFHNPPDG GLGKKSKTDF 
DWAPSPGTGG TFMWLSDSFT LPKGAPNRAG AVAWLKVAAS KEGQDAFNPK KGSIPARKDA 
DTSLYTDYLA DALKDWGSNK LAGSIQHGVT VNDAWRVSIN EAVGLFHTDK DVAALQAALA 
EAAKNSGQ