Gene Sros_4838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4838
Symbol
ID	8668132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5360404
End bp	5362104
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	70%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003340400
Protein GI	271966204
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGG TCGAGCCCGG CGCATTGCTG CCGAGCATGC GGCTGGATGA GCTCCTGTCG 
GAGCTGCAGA TGCGGCTGGA GGCGGTGCTG GCCACCCGGG ACCGGGTGCA CGCACTGTTG 
AACGCGGTCG TGGTGGTGGG CAGCGATCTG AATCTGGAGA CGGTGCTGCG CCGGATCGTG 
GAGACCGCCA CCATGTTGGT CGATGCCACC TACGGGGCGC TGGGAGCGGT GGGGGAGCAC 
AACACGCTGG TGCAGTTCAT CCCGGTGGGG CTGAGCGAGC AGGAGATCGC CCGGATCGAG 
CACTGGCCGC ACGGCCTGGG CCTGCTGGGT TTGCTGATCA AGGAGCCGCG GCCGCTGCGG 
CTGGCCCACA TCAGCGATCA CCCTGCGTCA TACGGGTTCC CGCCGGGGCA TCCGCCGATG 
GGGGCATTTC TGGGGGTGCC GATCCGGGTG CGGGAGGAGG CCTTCGGCAA CCTCTACCTG 
ACCGAGAAGC GCGGCGGAGG GGAGTTCGAC GCCGAGGATG AGGCGATCGT CACCGCGCTG 
GCCGCGGCGG CGGGCGTGGC CATCGAAAAC GCCCGATTGT ATGCCGACAG CCGCCGCCGG 
GAGCGCTGGC TGCAGGCCTC AGCGGAGGTC ACCACCAGCT TGCTGTCGGG GGCCGAGCCG 
GGACAGGTGC TCACGTTGAT CGCCCGGCGT GCGCGGGAGA TGGCCGGCGC CGACGTGGTG 
GCGGTGCTGT TGCCCGATGA CAGCGGGCGC ATCCTGCAGG CGGTGATCGC CGATGGGCTG 
GCCTGTGAGG AGGTGGCCTG TGCGCAGGCG CCGGTCGCCG ACTCTTTGGC GGGCCGAGCG 
TTCACCAGCG GTGAGCCGTT GATGGTGGCT GATCCGGCCG AGGCCGAGGT GCCGATCGCG 
ATCGCCGACT ACGTCTCGCT GGGACCGGTG GCCGTGGTGC CGATCGGCGC GCCGGGCAGC 
GTGCGCGGCG TGCTGTCGCT GGGCAAGCGC TCGGGCCGGC TGCCGTTCAG CCAGGCGGAG 
TTGCATACCC TGCACGCCTT CGCCGGGCAG GCCGCGATCG CGTTGGAGCT GGCCGAGAGC 
CGGATGGACG CCGAGCGGCT GGGGCTGCTG GAAGATCGCG ACCGGATCGC CAAGGATCTG 
CATGACGTGG TGATCCAAAG ATTGTTCGCC GTGGCGATGA CGCTGATGAG CACGGTGCGG 
CTGGTCGACA GACCGGAGGC CTCGGCTCGG CTGCAAACCT CGATCGATGA GCTGGATGCG 
ACCATCCGGC AGATCCGCTC GACCATTTTC GCCCTGCAGA TCTCTTCGGA AGACGGTGCG 
GAGGGGCTGC GCGCGCAGAT CACAGGACTG GTAGAGGGCG CCCGAGGCCA CCTGGGCTTC 
ATGCCGGCTC TGACCATGGA AGGCCGCCTC GACGCCATGG TGCCGGACCA GGTCGCCGAG 
CAGTTGCTGG CCGTGCTGAG GGAGGCGCTG TCCAACGTCG TGCGTCACGC CCGGGCCTCC 
AAGGTCGAGG TGGCGGTCGA GGCGGGTGAG GACCGGCTCG TCCTCACCGT CATCGACGAC 
GGGCTGGGGG TGCCGGAGGG CGGCCGGCGC AGCGGGCTGC GCAATCTCCA GGACCGGGCC 
GAACGCCTCG ACGGCTCTTT CACGGTCGAA TCTCGCCCAG GGGGCGGCAC CTGCCTGATG 
TGGAGTGTGC CGCTGACCTA A

Protein sequence

MAQVEPGALL PSMRLDELLS ELQMRLEAVL ATRDRVHALL NAVVVVGSDL NLETVLRRIV 
ETATMLVDAT YGALGAVGEH NTLVQFIPVG LSEQEIARIE HWPHGLGLLG LLIKEPRPLR 
LAHISDHPAS YGFPPGHPPM GAFLGVPIRV REEAFGNLYL TEKRGGGEFD AEDEAIVTAL 
AAAAGVAIEN ARLYADSRRR ERWLQASAEV TTSLLSGAEP GQVLTLIARR AREMAGADVV 
AVLLPDDSGR ILQAVIADGL ACEEVACAQA PVADSLAGRA FTSGEPLMVA DPAEAEVPIA 
IADYVSLGPV AVVPIGAPGS VRGVLSLGKR SGRLPFSQAE LHTLHAFAGQ AAIALELAES 
RMDAERLGLL EDRDRIAKDL HDVVIQRLFA VAMTLMSTVR LVDRPEASAR LQTSIDELDA 
TIRQIRSTIF ALQISSEDGA EGLRAQITGL VEGARGHLGF MPALTMEGRL DAMVPDQVAE 
QLLAVLREAL SNVVRHARAS KVEVAVEAGE DRLVLTVIDD GLGVPEGGRR SGLRNLQDRA 
ERLDGSFTVE SRPGGGTCLM WSVPLT