Gene Sros_1652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1652
Symbol
ID	8664929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1767946
End bp	1769265
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	74%
IMG OID
Product	Histidine kinase
Protein accession	YP_003337386
Protein GI	271963190
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.527879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.680022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCG AGACGGCAGT GGGCGGACCG GTGGTGGGCA TGCCGCCGCG GCGGCGCGTT 
CCGCTGGGGC CCAACGGGCC GCTGGGCATG CTCGTCGACC CGATGACCTG GCGTGCCGTG 
CCGTACATGC TGGTGAGCGT CTTCTACGGC GCGGTCTGCT CCGCCTTCAT GGCGTCCGCC 
ATCCCGATCG CGCTCAGCCT GGTGATCGTG TGGGCCGGAC TGCCGCTGCT CGCGCTGACC 
ATGTGCGCCT GGCGCGCCGC GGCGATGCTG GAGCGCAGGC TGGTCCGGCT GGCCTTCGGC 
GTCACGATCC GCGACCCCTA CCGGCCCTCC CGGGGCGACA ACCTGTTCCT GCGCTGGAAG 
GACATGTTCG TCGACCCGGC GACCTGGAAG GACCTCCTCT ACCTCCTGCT GTTGCTGCCG 
ATCGGAGTCG TGGAGTTCGT CGTCTCGGTG GCCCTGTGGT GCCTGGGGTT CGGCATGATC 
ATCGTGCCCA CCGTCCTGCT GTTCGGCGGA GCCCCGGTGA CGATCACCGA CGGGCTGCTG 
GTCGACAGCG TGCCGGAGGC GCTGCTGTGC GTGCCCGTCG GAGTGGGGGT CCTCCTCGTC 
GCGCTCTACG CGACGCGGGG GATGGCCTGG CTGCACGCGC TGCTCGCCGT CGCGCTGCTG 
GGGGCGGGGG AGAAGAACCT GCTGGCCGCC CGGGCGGCCC ACCTGCGGGC CAGCCGGGCC 
CGCGCGGTCG ACGCGGCCGA GGCGGAGCGG CGCAGGATCG AGCGCGACCT GCACGACGGC 
GCCCAGCAGC GGCTGCTCTC CGTCGCCATG GACCTGGGCC GGGCCCAGGC CAAGATGGAC 
TCCGACCCCC AGGGCGCCCG GGAGCTCCTC GCCCAGGCCC ACGCCGGCGC CAAGGCGGCG 
ATCGCCGAGC TGCGCGACCT CGCCAGGGGC ATCCACCCGG CGATCCTCAC CGACCGCGGA 
CTGGACGCGG CGCTCTCCTC GCTCGCGGCC CGAGCCCCCG TGCGGGTGGA CCTGTCGGTG 
GAGGTCTCCC ACCGCCCCCC GCCCGCGGTG GAGAGCATCG CGTACTTCGT CGTGGCCGAG 
TCCCTGACCA ACATGGTCAA GCACGCCGAG GCGACCGAGG TCTCCATCCG GGTCAGCCGC 
GAAGGCCAGC GGGTGGTCGT CGAGGTGCAC GACAACGGGG TCGGGGCCGC GGTGCCGCGC 
GCCGGAGGGG GCCTCGCGGG GCTGGCGGAC CGGGCCGCGA CCATCGACGG CACCCTGACC 
GTGGACAGCC CGCTCGGCGG TCCTACGCTG ATCCGCGCCG AACTGCCCTG CCAATGGTGA

Protein sequence

MTAETAVGGP VVGMPPRRRV PLGPNGPLGM LVDPMTWRAV PYMLVSVFYG AVCSAFMASA 
IPIALSLVIV WAGLPLLALT MCAWRAAAML ERRLVRLAFG VTIRDPYRPS RGDNLFLRWK 
DMFVDPATWK DLLYLLLLLP IGVVEFVVSV ALWCLGFGMI IVPTVLLFGG APVTITDGLL 
VDSVPEALLC VPVGVGVLLV ALYATRGMAW LHALLAVALL GAGEKNLLAA RAAHLRASRA 
RAVDAAEAER RRIERDLHDG AQQRLLSVAM DLGRAQAKMD SDPQGARELL AQAHAGAKAA 
IAELRDLARG IHPAILTDRG LDAALSSLAA RAPVRVDLSV EVSHRPPPAV ESIAYFVVAE 
SLTNMVKHAE ATEVSIRVSR EGQRVVVEVH DNGVGAAVPR AGGGLAGLAD RAATIDGTLT 
VDSPLGGPTL IRAELPCQW