Gene Sros_5904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5904
Symbol
ID	8669198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6473315
End bp	6474514
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	75%
IMG OID
Product	Histidine kinase
Protein accession	YP_003341382
Protein GI	271967186
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0106883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0686301
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCAACA CCCCAGGCGG CCTGCGGGCC TGGCTCCACG GACACCCGCT GATCTCCGAC 
GCCGCCCTGG CGGTGGCGCT TGCGGCCGCC GCCGTGCCGT GCGCCTACGT CACCTCCCTG 
TCCGGCTTCG ACGCCCCGGC CGGCGCCGCC GGGCCCGACG CGCTGGGCCT CACCCTGATC 
GTGGCCGGCT GCCTGTCCCC GGCGCTGCGC CGGCGTCTGC CGTTCACGAT GCTCTTCCTG 
GTCGGCGTCG TGGAGATGAC GCTGGCGTCA CTGGACCGGA GCGGCTCCCT GCTCTGGGTC 
GCCGCGCTGG TGCTGGTCTA CACGATCGCC GCCCGTCGCG GCCTGGCGCT CAGCCTGTGC 
GCGCTGGTGC TGAGCCTCAC CTACCGCGCC GTCTTCGCGG TGACGGCCGC CGACCCCGGC 
GACCGGACGG CGCACCTGTT CGTGGCCCTG CTGACCATGA CGCTGTGGAT CGCCGGGCGC 
GGTGTCCGGC TGCGCCGGGC CTACCTCGCC GAGCTGCGCG ACCGGGCCGG GCGGATGGAG 
CGGGCCCGGG AGGCCGACAC GCGGGCGGCC AGGGCCGAGG AGCGCTCCCG CATCGCCCGC 
GAGCTGCACG ACGTGGTCGC CCACCACGTG AGCGTGATGA CCGTCCAGGC CTCCGCGGCC 
CGCCGGGTGC TGGCCACCAA CCCCGACGGC GCCCGTGAGG CGCTGTCGGC GATCGAGGAG 
ATGGGCCGGA CCGCGATGGC CGAGATGCGC AACATCGTGG GCGTGCTCAG GACCGACGCG 
GCGCCCGCCG AGCGCAACCC CCAGCCGGGG GTGCAGGAGA TCCCCACCCT GGTCGACCAG 
ATGCGCGAGG CGGGCCTGCG GACGCAGCTG TGGATCGAGG GCCGGGAGGG CTCGCTGCCG 
CCCGGCGTCG ACCTGGCCGT CTACCGGCTG GTCCAGGAGG CGCTGACCAA CAGCCTGCGG 
CACGCGGGAC CGCAGGCCCG CGCCTGGGTG ACCGTACGGC AGGAGCCGGG CGAGCTGGCT 
GTCCGGGTCG AGGACGACGG TCAGGGCTCC GGCGCCGCCG GACCGGCCGA CGACCGGACC 
GGGCACGGGC TGGTCGGCAT CCGCGAGCGT GTGGCCCTCT ATGGTGGGAT CCTGAGGATC 
GGCCCGCGTC CGGAGGGCGG GTTCGAGGTC AATGCCCGGT TTCCCCTCAA GGACGTGTGA

Protein sequence

MRNTPGGLRA WLHGHPLISD AALAVALAAA AVPCAYVTSL SGFDAPAGAA GPDALGLTLI 
VAGCLSPALR RRLPFTMLFL VGVVEMTLAS LDRSGSLLWV AALVLVYTIA ARRGLALSLC 
ALVLSLTYRA VFAVTAADPG DRTAHLFVAL LTMTLWIAGR GVRLRRAYLA ELRDRAGRME 
RAREADTRAA RAEERSRIAR ELHDVVAHHV SVMTVQASAA RRVLATNPDG AREALSAIEE 
MGRTAMAEMR NIVGVLRTDA APAERNPQPG VQEIPTLVDQ MREAGLRTQL WIEGREGSLP 
PGVDLAVYRL VQEALTNSLR HAGPQARAWV TVRQEPGELA VRVEDDGQGS GAAGPADDRT 
GHGLVGIRER VALYGGILRI GPRPEGGFEV NARFPLKDV