Gene Sros_3521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3521
Symbol
ID	8666809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3900307
End bp	3902064
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	69%
IMG OID
Product	transposase IS4 family protein
Protein accession	YP_003339200
Protein GI	271965004
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.225727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGGGG ATACCGGCCG GGTGATCCCG GCGGAGACGG TCCGTGCGGC CTGGGCGGCC 
AATCCTTCTG GAACTCCGGC GATGTGGATC CGGGACCGGC TCGCGGGAGT GTTCGGCGAG 
AAGGACTTCG TCGGCTGGTT TCCCGCTGAT GGGCGGCGTG GATTGTCGCC GGTGGTGTTG 
GCGCTGGTCA GCGTGTTGCA GTTCGCGGAG AACCTGACCG ATCGGCAGGC GGCGCTGGCG 
GTGCGATGCC GGATCGACTG GAAGTACTGC CTCGGGCTGG AGCTGACGGA TCCGGGGTTC 
GACCACTCTG TGCTCTCGGA GTTCCGAGAT CGGATGGCCC AAGACGATCG GGCGGACCGA 
CTGCTGGCGG TGATGGTGCA ACGGCTGGTC GAGGCGGGGC TGGTCAAGCA GCGGGGCCGG 
GTCCGGACCG ATTCCACGCA TGTGCTGGCC GCGGTCCGCA AGCTCAACCG CGTCGAGTTG 
GTCGGGGAGA CGCTGCGGGT CGCGCTGGAG GAACTCGCCG CCGCCGATGA ACCCTGGCTG 
GCCGCCCTGA TCACCCCGGA GTGGGCCAGC CGCTATGGCC GGCCGGTCCG CTATGACCGG 
CTGCCGCGCG GCAAGGATGA TCTGGCCGCG CACGTGCTGC AGATCGGCCA GGACGGGATG 
ACGGTCCTGG AGGCGGTGCA TGCGGCCGGG GCGTCGCGTC GGCTGCGGGA TCTGCCGGGG 
GTGCAGGTAC TGCGTCAGGT ATGGGTGCAG CAGTACTGGA CAGACTCCTA CGGTGATCTG 
GCCTGGCGAG CCGCCAAGTC CAGCCGGGAC CGGCAGAGCC GCCACGGCCG GCCGCGTCGG 
TCATCCGGCG AGGAAAGCGG CCAACAGCCG GACCCGGCAC GGGTGCCATG GTCCGGGATC 
GAGATCGTCA GTCCGCACGA TCCCGAAGCC CGGTACTGCC GCAAGGAAGG AAAAACGACC 
ACGAAAGCTG AGTGGGTCGG CTACCGGGAT CATCAGAGCG AGACCTGCGA CGACAATGTT 
CCCAACGTGA TCGTTCACGT CCTCACCCGC CCGGCGCCGG TCCAGGACAT CGATGCCGTG 
GACGACATCC ACGCGGGCCT GGCCGCCAGC GGCTTGACCC CGGCCGAGCA TCTCCTCGAC 
AGCGGATACG TCACCCCGGA CGTCATCCAC CACACCGCCC AGCAGTGGGG CGTCGCTCTG 
ATCGGGCCAG TTCGAGCCGA CCCGCGAGGC CGCCACGGGT TCACCAAGGA AGACTTCCAC 
GTCAACTGGG ACGATCACAC CGTCACCTGC CCGCGCGGGG TGACCAGCCC GCCCTTCAAA 
CCCACCCTCG GCGATGGCAA GCCTCGCCTG TCGGTGCTGT TCCCCCGCGC GGCCTGCCGG 
GCCTGCCCAG ACCGCCAGGC CTGCACCGGT GACGCCAACG GCAAGGGTCG CCACCTCACC 
CTGCTGCCCG AGCCGCTGCA GCAGATCCAG ACCCGCAATC GCGCCGACCA GCACACCGAA 
CCTTGGAAGG CCCGCTACGC CCTGCGCGCC GGCTGCGAGG CCACCGTCTC CGAAACCACC 
CGCGCCCACG GCCTACGCAA TTGCCGCTAC AAAGGCCTCG CCAAAACCCA CGTCCAGCAC 
GTCCTGACCG CGGCCGGCAC CAACGTCATC CGCCTCGCCG ACTGCTACAC CCCCGGCATC 
ATCCCCGACC GACCGCCACG TCCGATCAGC CCGTTCCAAC AACTCTGCCG ACGGCTGGCC 
GCCCAGACCC CAGAATGA

Protein sequence

MGGDTGRVIP AETVRAAWAA NPSGTPAMWI RDRLAGVFGE KDFVGWFPAD GRRGLSPVVL 
ALVSVLQFAE NLTDRQAALA VRCRIDWKYC LGLELTDPGF DHSVLSEFRD RMAQDDRADR 
LLAVMVQRLV EAGLVKQRGR VRTDSTHVLA AVRKLNRVEL VGETLRVALE ELAAADEPWL 
AALITPEWAS RYGRPVRYDR LPRGKDDLAA HVLQIGQDGM TVLEAVHAAG ASRRLRDLPG 
VQVLRQVWVQ QYWTDSYGDL AWRAAKSSRD RQSRHGRPRR SSGEESGQQP DPARVPWSGI 
EIVSPHDPEA RYCRKEGKTT TKAEWVGYRD HQSETCDDNV PNVIVHVLTR PAPVQDIDAV 
DDIHAGLAAS GLTPAEHLLD SGYVTPDVIH HTAQQWGVAL IGPVRADPRG RHGFTKEDFH 
VNWDDHTVTC PRGVTSPPFK PTLGDGKPRL SVLFPRAACR ACPDRQACTG DANGKGRHLT 
LLPEPLQQIQ TRNRADQHTE PWKARYALRA GCEATVSETT RAHGLRNCRY KGLAKTHVQH 
VLTAAGTNVI RLADCYTPGI IPDRPPRPIS PFQQLCRRLA AQTPE