Gene Sros_3067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3067
Symbol
ID	8666354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3346481
End bp	3347491
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	68%
IMG OID
Product	aliphatic sulfonates family ABC transporter, periplasmic ligand-binding protein
Protein accession	YP_003338760
Protein GI	271964564
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.147181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.352902
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCATC CCCGCCGGCT GATCGCGTCC TTCGGCGCCG CCCTGGCCCT GCTCCTCCCC 
GTCGCCGCGT GCGGATCCTC CGCCGATTCC GCGGACTCCG CCGACGGCGC CAAGAAGGTC 
TCCTTCGGCT ACATCGCCGA CTTCTCCGGC AGCGCGACCC TCGCCGCCGC CGACAAGCTG 
GGCCTGTGGG CCAAGCAGGG TCTCACGCCC GATCTGAAGG TCTTCACCAA CGGCCCGCTG 
CAGATCCAGG CCCTGGGCGC GGGCGACCTC GACTTCGGCT ACATCGGCTC CGGCGCGACC 
TGGCTGCCCG CCTCCGGGAA GGCGAAGATC ATCGCGGTGA ACATGCTCGG CCTGGCCGAC 
CGGGTCATCA CCCACGCCGG CTCCGGCATC ACCTCGATCG CCGACCTGAA GGGCAAGAAG 
GTCGGCGTGC CCGAGGGCAC CTCCGGCGAC ATGATCCTGC AGCTCGCCCT CAAGGAGGCG 
GGCCTCACCC CGGCGGACGT GCAGAAGGTC ACCATGGACG CGAGCACGGT GGTCACCGCG 
TTCTCCTCCA AGCAGGTCGA CGCCGCCGCC ATCTGGTACC CGCTGATCGA CACCATCAAG 
AAGAACGTCC CCGACCTGGT CGAGCTGAAG AAGAGCGAGG ACTTCTACCC CGAGCTGAGC 
TTCCCCAGCT CCTTCGTCGC CCGCAACGAG CTGGTCAAGG ACGACGCGGC GACGGTGACC 
AAGGTGCTCA AGGTCATCCA GGAGGCGAAC GACTGGGTGG CGGCCAACAC CGCCGAGGCC 
GAGACGCTCA CCGCGACCTT CCTGAAGGTC CCGGCCGAGC AGTTCAAGGG AGCCTCGGCC 
GTCACGAAGA TCCTGCCCAG CGCCGAACTG GCGAAGTTCG GCGACGACGG CACGGTCGGC 
GGCTGGTACA AGGGCCTGGC CGACATCTTC GTCACCATGG GCAAGATCAA GGAATCTCCC 
GACCCCGCCA CCTACTACAC CGCCGACCTC TACAAGGCGG CCCTCGGCTA G

Protein sequence

MRHPRRLIAS FGAALALLLP VAACGSSADS ADSADGAKKV SFGYIADFSG SATLAAADKL 
GLWAKQGLTP DLKVFTNGPL QIQALGAGDL DFGYIGSGAT WLPASGKAKI IAVNMLGLAD 
RVITHAGSGI TSIADLKGKK VGVPEGTSGD MILQLALKEA GLTPADVQKV TMDASTVVTA 
FSSKQVDAAA IWYPLIDTIK KNVPDLVELK KSEDFYPELS FPSSFVARNE LVKDDAATVT 
KVLKVIQEAN DWVAANTAEA ETLTATFLKV PAEQFKGASA VTKILPSAEL AKFGDDGTVG 
GWYKGLADIF VTMGKIKESP DPATYYTADL YKAALG