Gene Sros_5939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5939
Symbol
ID	8669233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6511415
End bp	6512914
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	70%
IMG OID
Product	twin-arginine translocation pathway signal
Protein accession	YP_003341417
Protein GI	271967221
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.161214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000467819
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGCCAGA TCGATCCCGA TTTCCTCGCT CTGCCCCTGA GGCGGCTGGC GGACGCGGCC 
CTGCAACGCG CCCGTGACCT CGGCGCCGAG CACGCCGACT TCCGGCTTGA GCGCGTCCGC 
TCGGAGACCC TGCGCCTGTC CGACGCCTCA CTCGAAGGCG CCATCGACGC CGACGACCTC 
GGCTACGCCG TACGGGTCGT CAAGAACGGC ACCTGGGGCT TCGCCTCCGG CATCGACCTT 
ACCCCTGAGG CGGCCGTGAG GGCCGCCGAG CAGGCGGTGG AAGTGGCCGT CATCTCCGCG 
GCCGTCAACC GCGAACCCAT CACGCTGGCC CCCGAACCGG TCCACTCCGA CGTCACCTGG 
GTCTCGGCCT ACGACGTCGA CCCCTTCGCG GTGCCGCTGC GCGACAAGGT CGCCCTGCTC 
GCCGACTGGT CGGACGCCCT GCTGAGGGAG CCGCGAGTGG ACCACGTCCA GGCCTCGCTG 
CAGCAGGTCA AGGAGCAGAA GTTCTACGCC GACACCGCCG GCACCTCCAC CACCCAGCAG 
CGGGTGCGCC TGCACCCCGA GCTGGAGGTG ATGAAGGTCG AGGACGGGCG CTTCGAGTCG 
ATGCGCACGC TGGCCCCGCC GGTCGGCCGG GGGTACGAAT ACCTCACCGG CACCGGCTGG 
GACTTCCCCG GCGAGCTGGC CCGCCTGCCC GAGTTCCTCG AGGAGAAGCT GAAGGCGCCC 
TCCGTCGAGG CGGGACGCTA CGACCTGGTC ATCGACCCGT CCAACCTGTG GCTGACGATC 
CACGAGTCCA TCGGGCACGC CACCGAGCTG GACCGGGCCC TCGGCTACGA GGCGGCCTAC 
GCCGGGACCA GCTTCGCCAC CTTCGACCAG CTCGGCAAGC TGGTGTACGG CTCGCAGGTG 
ATGAACGTGG TCGGCGACCG CACGACGGAG CACGGCCTGT CCACGGTCGG CTACGACGAC 
GAGGGCGTGG CGACCAAGCG GTTCGACATC GTCTCCGGCG GCGTCCTGGC CGGATACCAG 
CTCGACCGGC GGATGGCGCG GTTGAAGGGC CTCGGCGCCT CCAACGGCTG CGCCTTCGCC 
GACTCCCCCG GCCACATGCC GATCCAGCGC ATGGCCAACG TCTCGCTGCT GCCTGCGCCC 
GATGGACCCT CCACCGAGGG GCTGATCTCC GGGGTGGAGC GCGGCATCTA CGTCGTGGGC 
GACAAGAGCT GGTCCATCGA CATGCAGCGT TACAATTTCC AATTCACCGG CCAGCGGTTC 
TACCGGATCG AGAACGGCAG GATCGCCGGC CAGGTCCGCG ACGTCGCCTA CCAGGCCACG 
ACCACCGACT TCTGGCGGTC GATGGCGGCC GTCGGCGGGC CGCAGACCTA CGTGCTGGGC 
GGCGCGTTCA ACTGCGGCAA GGGCCAGCCC GGCCAGGTCG CCCCGGTCAG CCACGGCTGC 
CCGTCGGCGC TCTTCCGCGA TGTGCGCATT CTCAACACCC TGCAGGAGAG TGGCAATTGA

Protein sequence

MRQIDPDFLA LPLRRLADAA LQRARDLGAE HADFRLERVR SETLRLSDAS LEGAIDADDL 
GYAVRVVKNG TWGFASGIDL TPEAAVRAAE QAVEVAVISA AVNREPITLA PEPVHSDVTW 
VSAYDVDPFA VPLRDKVALL ADWSDALLRE PRVDHVQASL QQVKEQKFYA DTAGTSTTQQ 
RVRLHPELEV MKVEDGRFES MRTLAPPVGR GYEYLTGTGW DFPGELARLP EFLEEKLKAP 
SVEAGRYDLV IDPSNLWLTI HESIGHATEL DRALGYEAAY AGTSFATFDQ LGKLVYGSQV 
MNVVGDRTTE HGLSTVGYDD EGVATKRFDI VSGGVLAGYQ LDRRMARLKG LGASNGCAFA 
DSPGHMPIQR MANVSLLPAP DGPSTEGLIS GVERGIYVVG DKSWSIDMQR YNFQFTGQRF 
YRIENGRIAG QVRDVAYQAT TTDFWRSMAA VGGPQTYVLG GAFNCGKGQP GQVAPVSHGC 
PSALFRDVRI LNTLQESGN