Gene Sros_4673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4673
Symbol
ID	8667967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5197494
End bp	5198693
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003340269
Protein GI	271966073
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.113165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.377169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCGG GCGTGAATGA GCCAGGGGTG GATGAGTGGG GCGTCGATGA GTCGGGCGTG 
AAAGGAAAGA GCCGGGGCGC GGCTCTGCGT TACCTCTGCG CCACTGTTCC TGCGCTGTTC 
GTCAGCGGGA TCTCGATCCT GTCAGCCGTG AACCGCGAGG TCGCCCCCGA CCTCGCCCAG 
ATTGCGCTGG ACCTGGCCCT GTTCGGGGCC GGTCTGGCGC TGATGCGATG GCGACACCGC 
TTCCCCTGGC AGGTCGCGCT GGCGACCGCA CTCCTGACCC TCTACTCGAC CACCGCGGCC 
GGCCCCGCCT ACGTCGCCTA CGTCTCCCTG TGCACGCATC GCCGTTGGCG CCAGATCGTC 
CCGGTCGCTC TCGCCACGTG GCTGTGCCCG GCGGCGCAGA TCCTGTGGTC GGACGCAGAC 
AAGCTCAGGG TCGTCTCCGT CACGAGCGTC ACCATGGTGA CCGGCAGCGT GATCGTCGGC 
GGACTGACCG TCTTTGGCCT CTACCTGCGC GCGCGGCGCG ACCTGGCCGC CTCGCGGCGA 
CGGGCCGCGC TCGAGGCGCA GGCGCACCGC GTCGAGCAGG CCAAACTAGC CGAACGGGTC 
AAGATCGCCC ACGAGATGCA TGACGTGCTG GCACACCGGA TCTCTCTGCT GGCCATGCTC 
GCGGGCGGCC TGTCGCACCG CACCGACCTC ACCGCCGAGC AGACCCGCGA AACGGCCCAG 
GCGATTCAGG AGAACGCACA CCAGTCGCTC AACGAACTGC GCGCCGTACT CGGCACGCTG 
CGGCGCGACG GCGGCGTCGA GGACCCGCAG CCGAACCTGG CCGACCTCGA CGCCCTGTTC 
GACGAAGTAC GCGTGGCCGG GCAGCAGGTC GAGGTGGCCG ACACTGTCGA CGGGCGCGAG 
CTGCTGCCGG CGCAGACAGG GCGGCACGCG TACCGGATCG TGCAGGAGGC GCTGACCAAC 
GCGCGCAAGC ACGCGCCGGG CACCCGAGTG AGAGCCGAGC TCGGCGGACG GCCTGGCCAA 
GGGTTACGGA TCCGGATGAG CAACCCGGCT CCATACGCCG GATCGTCCAG CCCCGGCTCC 
GGCGGGCGGC TGGGCCTGGT CGGGCTGGCC GAGCGTGCCC GGATGGCCGG GGGCACCCTG 
AGCCATGCGG TCCAGGACGG ACGCTTCGTC CTGGACGTGC GACTGCCGTG GGAGGCTTGA

Protein sequence

MLSGVNEPGV DEWGVDESGV KGKSRGAALR YLCATVPALF VSGISILSAV NREVAPDLAQ 
IALDLALFGA GLALMRWRHR FPWQVALATA LLTLYSTTAA GPAYVAYVSL CTHRRWRQIV 
PVALATWLCP AAQILWSDAD KLRVVSVTSV TMVTGSVIVG GLTVFGLYLR ARRDLAASRR 
RAALEAQAHR VEQAKLAERV KIAHEMHDVL AHRISLLAML AGGLSHRTDL TAEQTRETAQ 
AIQENAHQSL NELRAVLGTL RRDGGVEDPQ PNLADLDALF DEVRVAGQQV EVADTVDGRE 
LLPAQTGRHA YRIVQEALTN ARKHAPGTRV RAELGGRPGQ GLRIRMSNPA PYAGSSSPGS 
GGRLGLVGLA ERARMAGGTL SHAVQDGRFV LDVRLPWEA