Gene Sros_3797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3797
Symbol
ID	8667087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4232371
End bp	4233660
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	67%
IMG OID
Product	IS605 family transposase OrfB
Protein accession	YP_003339460
Protein GI	271965264
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.9215
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.414505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTACCG GACGCAAGTA CCGCCTGGAC TTCACCCCCG AGCAGGGTGA ATTCGCCGAA 
CGCATCGGCG GGGCGTGCCG GTCGGTGTGG AACACCGCGC TGGAACAGCG CCGGATCTAC 
CGTCGGCGTG GTGGGTGGAT CGGCTATCAC GACCAGGCCC GCCAAGTGGC TGAGGCGAAA 
GATGACTTCC CCTGGCTGGC CGAGGTGCCC GGTCACTGCC TGCAGCAGGC GTTGATCGAC 
CTGGATCAGG CGTGCGCCAG GCACGGCACG TGGAAGGTCC GCTGGAAGTC GAAGGTCGCC 
AACCCGCCGA GCTTCCGATT CCCTGAGGGC GGGAAAATCA CGGTCGAGCG GCTCAACCGG 
CGCTGGGCGC GAGTGAAGCT GCCGAAACTC GGTTGGGTCC GCTTCCGCCT CACCCGCCCG 
CTCGGCGGGA AGGCCAAGAA CGCCACCGTC AGCCGGGACG GTGAGCATTG GTACATCAGC 
TTTCTCGTCG AGGACGCAGT CACCCCGCCT GAGCGGCACG CCGACCCCGG CAGCGCCGTG 
GGGATCGACC GGGGCGTGGT CAAGGTCGTG ACCCGCTCGG ACGGCCGCTT CCACCATCGG 
GTGTTCGCCC GTGATCGGGA AGTCGAGCAT GCCAAGAAGC TTCAGCGAGA CTTCGTCCGG 
ACCGCGAAGG GATCGGCCCG GCGCAAGGAA GCTGCCGGGC GGGTCGCCGC TATGGCGCGG 
AAGGTCCGCA GACGCCGGGA GGACTTCGCC GCCAAGACCG CCCATACCCT GGCCACGGGC 
TTTGAAATGG TCGTGTTCGA GGCGCTCACG ACCAAGAACA TGACCGCTGG CGTCGAACCC 
AGGCCAGACC CTGAGCAGCC GGGCGCGTTT TTGCCGAACG GGGCCGCCGC TAAGACCGGA 
CTGAACCGGT CTATCTTGGA CAAGGGCTGG TACCGGATCG AGCTGGCCAC CCGTAGTAGG 
GCCCGGTATA CGGGCACCCA CGTGATCACT GTCAACCCGG CGTACACGAG TCAGACGTGC 
AACGTGTGCA CGGTGGTGGA CCGGAAGTCC CGCGAGAGCC AAGCGGTCTT CCGGTGCACC 
TCGTGCGGAC ACATCGAGCA CGCCGACGTG AACGCCGCCA AGAACGTACT CACCGCCGGG 
AGGGCGGAGT TCGCACAGCC CAGACCGGGT GTGCGGGCTG GGGCGCGCAA ACCACGCAAC 
CGCGTGGGCC GCAAGGCCAA TCGCCAAGCA ACAGCAGCGC AGAGCACCGC AACAGCGGGG 
TCCGGGCTGG CTGGAATCCC CCGGCTTTAG

Protein sequence

MLTGRKYRLD FTPEQGEFAE RIGGACRSVW NTALEQRRIY RRRGGWIGYH DQARQVAEAK 
DDFPWLAEVP GHCLQQALID LDQACARHGT WKVRWKSKVA NPPSFRFPEG GKITVERLNR 
RWARVKLPKL GWVRFRLTRP LGGKAKNATV SRDGEHWYIS FLVEDAVTPP ERHADPGSAV 
GIDRGVVKVV TRSDGRFHHR VFARDREVEH AKKLQRDFVR TAKGSARRKE AAGRVAAMAR 
KVRRRREDFA AKTAHTLATG FEMVVFEALT TKNMTAGVEP RPDPEQPGAF LPNGAAAKTG 
LNRSILDKGW YRIELATRSR ARYTGTHVIT VNPAYTSQTC NVCTVVDRKS RESQAVFRCT 
SCGHIEHADV NAAKNVLTAG RAEFAQPRPG VRAGARKPRN RVGRKANRQA TAAQSTATAG 
SGLAGIPRL