Gene Sros_1334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1334
Symbol
ID	8664609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1380464
End bp	1381741
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	71%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003337072
Protein GI	271962876
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.134624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.173507
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGTC GACTGCTCTC CTCCACTCTG CTCGTCGCGG TCATCGGGGT GCTTCTGCTC 
GGCATCCCCC TGGGTGTGGC GGTCAACCGG CTGATCGAGG AAGAGGCGAC CCAGGAGCTC 
TCCTCCCAGG CCAAGAGCCT GCTGGGGGAA GTGGAGTACG CCCGGATCCA GGATCAGCCC 
ATCGATCCCG AACAGCTCAA GCGCAAATAT CCCGACCGCT ACATCCAGAT CTATGCGAAG 
GGGACGCCGC CGCAGGTGAC GACGGTGGGC GACGAGCCCC CCGAGAACCA CAAGATGACC 
CAGGACGCCC AGTCGGAGAA CGGGGTGTAC GTCGCGGTCA GCCGAGACAA GACGGAGGTG 
GAGCGCGAGG TCCGGGCGTG GCTCCTGCTC ATCCTGGCGC TCGCCGCGGC GGCGCTCGCG 
GTCGCGGTCG GGCTCGCCAT CGTGCAGTCG CGCCGTCTGA CGCTCCCGCT CAGCGACCTG 
GCGATGATCG CTGAGCGGCT CGGCTCGGGG GACGCCAGGC CGAGCAAGCA CCGTTACGGC 
ATCCAGGAGC TCGACCGGGT GGCCGAGGTG CTGGACCGCA GCGCGACCCG GATCTCCGAC 
CTGCTGGCCA GGGAGCGGGA GTTCGCGACC GACGCCTCGC ACCAGCTCCG CACGCCGCTC 
ACCGGGCTGA CCATGCGGCT GGAGGAGATC GTGGCGGCCG CGCACGAGCC CGGCATCGTC 
AAGGAGGAGG GCGAGGCCGC CATCGTGCAG GCCGAGCGGC TCACCGCCGT GATCGACGAG 
CTGCTGGCCG CCGCCAGACG GCAGCGGCAC GCCCAGACCG AGGTGGTCGA GCTCGACGAC 
CTGCTGGACC AGCAGTTCAT CGAATGGGGT CCGGTGTTCC GCCGGGGCGG GCGGCAGCTC 
AAGCTGTCCG GCACGCGCGG TCTCCAGGCG GTGGGCACCA GCGGCGGCAT CAGCCAGGTG 
ATCTCCACTC TCCTGGAGAA CTCGCTGGAG CACGGCGACG GCACGGTGAC GGTGACCACC 
AGCGACAAGG ACAGGTCCGT CCTCGTCGAG GTCGCGGACG AGGGAGAGGG CATCCCCGAA 
GACCTCGCCC CCCGGGTCTT CGAGCGCAAC GTGAGCGGCG CGGGGGGCAC CGGGCTGGGG 
CTGACCCTCG CGCGGGCGCT GGCCGCCGCC GACGGCGGAC GCCTGGAGTT GGTACGGCCG 
CGCCCCGCGG CCTTCGCGCT GTTCCTCCGG CAGGTCGGCG ACCCCGGCAG AAAACGGGTG 
GTCAGCGGGC CGGCATGA

Protein sequence

MRRRLLSSTL LVAVIGVLLL GIPLGVAVNR LIEEEATQEL SSQAKSLLGE VEYARIQDQP 
IDPEQLKRKY PDRYIQIYAK GTPPQVTTVG DEPPENHKMT QDAQSENGVY VAVSRDKTEV 
EREVRAWLLL ILALAAAALA VAVGLAIVQS RRLTLPLSDL AMIAERLGSG DARPSKHRYG 
IQELDRVAEV LDRSATRISD LLAREREFAT DASHQLRTPL TGLTMRLEEI VAAAHEPGIV 
KEEGEAAIVQ AERLTAVIDE LLAAARRQRH AQTEVVELDD LLDQQFIEWG PVFRRGGRQL 
KLSGTRGLQA VGTSGGISQV ISTLLENSLE HGDGTVTVTT SDKDRSVLVE VADEGEGIPE 
DLAPRVFERN VSGAGGTGLG LTLARALAAA DGGRLELVRP RPAAFALFLR QVGDPGRKRV 
VSGPA