Gene Sros_1413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1413
Symbol
ID	8664688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1473423
End bp	1475162
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	72%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003337150
Protein GI	271962954
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.119595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0381206
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTCCT CGCCGAAGAA GCGCCGCCGT ACCCCGCGCC AGGTGGTGCG GGGCGTCCGC 
CGGCGGGCCC GTCGCGCCGC GGGAGGCGTG CGCCGGGTCT GGCGGCGCTC CCTGCAGCTC 
CGCGTCGTCA CCAGCACGAT GGTCATCTCC ATCGCGGTGG TGGCCGTGCT CGGCGTCTTC 
CTCATGCAGC AGATCATCGC GACCACGCTC CAGGACCGGG AGCGCGCGGC CAGGAGCGAG 
GCGCAGGCCG ACCGGAACGC GGTGCTCGGC TACCTGAACC GGCCGTCCGG CGACGTCTCC 
AAGCCGTCCG TCGATTCGGG CGACGGGCTC CAGCGGGGTG GCGACAGCCC GCTCAGCCAG 
GCGGTCTACG CCCTCGCCGG GCGCGCGGGG GCCGTCCCCC GCTACTCGGT GATCGCCCGC 
AACGACAACC AGCCGGGGGA GTTCTTCGTC ACCCCGAACA TCGATCCGCG CAGCATCCCG 
TCCGGGCTGC GCGAGGAGGT GTCCAAAAAG GAGGCGGGCG AGGACAGCAC CCACTACGGG 
GACCTCTACT ACGAGGGCAG GCGCGAGCCG GTGCGGGGCA TGGTGATCGG CACCCGCCTC 
GACACCTCCG GGACCATGCT GGACAGCGGA TACGAGATCT ACCACCTCAT CCCGCTGGAC 
AAGGAGGAGG AGACCCTCAA CTCGGTCCTG CGGATGCTCG TCGCCGTCGG GGCCGCCCTG 
GTGCTGCTGC TGGCGGCCAT CGCCTCGCTG GTCACCCGCC AGGTGGTCAC GCCGGTACGG 
CTGACGCGCC AGGCCGCCGA GCGGCTGGCC GCCGGACGCC TGGACGAGCG GCTGAAGGTG 
CGCGGCGAGG ACGACCTGGC CCGCCTGGCC ACCTCCTTCA ACGACATGGC CGCCAACCTG 
GCGTTGAAGA TCCACCAGTT GGAGGAGCTC TCCCACGTCC AGCGGCAGTT CGTCTCCGAC 
GTCTCGCACG AGCTGCGCAC CCCGCTGACC ACCGTGCGGA TGGCCGCCGA CCTGCTCTAC 
GACGCCCGCG AGGACTTCGA CCCGATGGCC GCCCGCTCGG CCGAGCTGAT GCAGAACCAG 
CTCAACCGGT TCGAGTCGAT GCTCGCCGAC CTGCTGGAGA TCAGCCGCTA CGACGCGGGC 
GCGGCCGAGC TGGACGTCGA TCCGGTGGAC GTCAGGGACG TGGTGCTGCG CGCCGTCGCC 
GACTCCGAGG CACTGGCCGA GCGCCACTCG ACCCGGTTCG ACCTGCGCCT GCCGGGTGAG 
CCCTGCATGG CGGAGATGGA CAGCCGCCGG GTCGAGCGGA TCCTGCGCAA CCTGCTGTTC 
AACGCGATCG AGCACGGCGA GGGCCGCGAC ATCGTCGTCT CGGTGGGGGC CGACCGCGAC 
GCGGTGGCGG TGGCCGTACG GGACCACGGG GTGGGTCTCA AGCCGGGTGA GGAGAACATG 
GTCTTCGACC GGTTCTGGCG GGCCGACCCG TCACGCGCGC GGACGATCGG CGGCACCGGC 
CTGGGCCTGG CGATCTCCCG CGAGGACGCC GTGCTGCACG GCGGCTGGCT CCAGGCCTGG 
GGGGCGCAGG GCGAGGGGTC GCAGTTCCGG CTCTCCCTGC CCCGGGTGGC CGGGGCGCCG 
CTGCGGGGGT CACCGCTGTC GCTGGTCCCG CCGGAGGTGG AGATGCGGCG GACATGGCGG 
GGGCACATGA CCCCGGTGCT CTCACCGGCG GTCGCCGACG GGGGAAACGA TGCGGACTAG

Protein sequence

MPSSPKKRRR TPRQVVRGVR RRARRAAGGV RRVWRRSLQL RVVTSTMVIS IAVVAVLGVF 
LMQQIIATTL QDRERAARSE AQADRNAVLG YLNRPSGDVS KPSVDSGDGL QRGGDSPLSQ 
AVYALAGRAG AVPRYSVIAR NDNQPGEFFV TPNIDPRSIP SGLREEVSKK EAGEDSTHYG 
DLYYEGRREP VRGMVIGTRL DTSGTMLDSG YEIYHLIPLD KEEETLNSVL RMLVAVGAAL 
VLLLAAIASL VTRQVVTPVR LTRQAAERLA AGRLDERLKV RGEDDLARLA TSFNDMAANL 
ALKIHQLEEL SHVQRQFVSD VSHELRTPLT TVRMAADLLY DAREDFDPMA ARSAELMQNQ 
LNRFESMLAD LLEISRYDAG AAELDVDPVD VRDVVLRAVA DSEALAERHS TRFDLRLPGE 
PCMAEMDSRR VERILRNLLF NAIEHGEGRD IVVSVGADRD AVAVAVRDHG VGLKPGEENM 
VFDRFWRADP SRARTIGGTG LGLAISREDA VLHGGWLQAW GAQGEGSQFR LSLPRVAGAP 
LRGSPLSLVP PEVEMRRTWR GHMTPVLSPA VADGGNDAD