Gene Sros_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0101
Symbol
ID	8663365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	102379
End bp	103797
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	76%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003335900
Protein GI	271961704
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.128582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCATC TATCGGTCAG GGTCCGGGCG ACCCTCGCCG CCACCGCCAT CGTCGCGGTC 
GCGCTGGGCG TCGCGGCGGT GGTGCTCGTC GGCGTGCTCA AGGGCAGCCT CGTGGACAGC 
GCCTCCGCCG AGGCGACCCG GCGCGCCTAC GGCACCGCCG GCATGATCAC CGCCAGCCCC 
GGGCTCATCG CCGGCAGGGT CGCCGAGCCG CTGGACCCCG ACGTCCAGGT CATCGAGAAG 
GCCGAGCTCT CCGAGGCGGA GTGGCGAACG GTCTTGGCCC AGCCCGCCCA GCCCGCCCTG 
CCGATCACCT CCGGACAGGA CACCCCCGGA ACGGGAGCGA TCCGATCGGA CACCACCCGG 
TCGACCGCCA CCCGAGGAGA GACAGCCCGA TCGGACGCCG CCAGGCCGGA CAGCACTGGA 
CCGGCCGCCG TACGCGCCGA GCGGTGGGCG CCCGCCGCCT CGTTCACGGT GGCCACGATG 
CCCGTGTCCA CCGTCGACGG CGTGGTGCTC GTCCAGGCCA GGGCCTCCCT GGAACCCGCC 
GGCGCCGCCC TGCAGACCCT GCAGGGGCTG CTGATCCCCG GCATCCCCGG GCTGCTCCTG 
CTGGTCGCGG CCCTGACCTG GCTGGCGGTC GGCCGCGCGC TCGCACCGGT CTCGGCCATC 
CGCACCGAGA TGGCCGACAT CACCGCCAGT GATCTGCACC GCCGGGTCCC GGTGCCGCGG 
TCCCGCGACG AGATCGCCCG CCTCGCCGAG ACGATGAACC GCACGCTCGA CCGCCTGGAA 
CTCGCCGTCG ACCGGCACAA GCGCTTCGTC GCCGACGCCG CCCACGAGCT GCGCAGCCCG 
CTGGCCATCC TGAGGACCCG CCTGGAGCTC GCCCCGCCCG GACCGCTGGC GGCCGAGGCG 
CTGACGGACG TGGAGCGGAT CCAGGCGCTC ACCTCCGACC TGCTGCTGCT GGCCCGCCTG 
GACGCCGGTG AGCCCGCCTG TCACGGGGAG GTGGACCTCG GACAGGTCGC CGCCGAGGAG 
GCGACCCGGG CCCGGCCCAG GCCGGAGATC CGCGTGGAGC TGGAGGTGGC CGCCGACGTG 
GTGGTCCGCG GATCGGCCGA GGAGCTGCGC CGCCTGGTCG CCAACCTGGT GGACAACGCC 
GTACGGCACG CGGACTCGAC GGTCACCGTC CGCCTGGCCC GGGACGGGGG CGGGGCCGTA 
CTCGACGTGC GCGACGACGG GCCGGGGATC CCGGCCGAGC ACCGTGAGGC GGTCTTCGAC 
CGGTTCACCC GGCTGGACGA GGCCCGGGGC CGGGACGCGG GCGGGTCGGG GCTCGGCCTC 
GCCATCGCCC GGGACATCGC GGTACGGCAC GGCGGCGGCC TGAGTGTCGT CGGGGGAGGT 
CCGGGAGCGC GGCTGCGGAC CCGTCTTCCC GCGCCGTGA

Protein sequence

MSHLSVRVRA TLAATAIVAV ALGVAAVVLV GVLKGSLVDS ASAEATRRAY GTAGMITASP 
GLIAGRVAEP LDPDVQVIEK AELSEAEWRT VLAQPAQPAL PITSGQDTPG TGAIRSDTTR 
STATRGETAR SDAARPDSTG PAAVRAERWA PAASFTVATM PVSTVDGVVL VQARASLEPA 
GAALQTLQGL LIPGIPGLLL LVAALTWLAV GRALAPVSAI RTEMADITAS DLHRRVPVPR 
SRDEIARLAE TMNRTLDRLE LAVDRHKRFV ADAAHELRSP LAILRTRLEL APPGPLAAEA 
LTDVERIQAL TSDLLLLARL DAGEPACHGE VDLGQVAAEE ATRARPRPEI RVELEVAADV 
VVRGSAEELR RLVANLVDNA VRHADSTVTV RLARDGGGAV LDVRDDGPGI PAEHREAVFD 
RFTRLDEARG RDAGGSGLGL AIARDIAVRH GGGLSVVGGG PGARLRTRLP AP