Gene Sros_4218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4218
Symbol
ID	8667512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4700580
End bp	4701776
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	77%
IMG OID
Product	Signal transduction histidine kinase-like protein
Protein accession	YP_003339863
Protein GI	271965667
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0481493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000385051
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGGCG ACATCCACTG CGGCGAAGGG GCGGGAGCCG CCCGCCCGCG CGCCCCCGGA 
ACCGGGATCC CCGCCGCGGT CATCATGGTC GTCGGGATGG GCGCCCTGGT CGCGCTGACG 
ATCTGGGGCC TGTCCGACGC GCATCCGACG GGGGAGTCGC TGGGTCGTGA CATCGCGGCC 
GGGGTGCTGG GATGCGTCCT GTCGCCGGTT CTGCTGCGGT GGCCGGTCAC CGGCGCGCTG 
GGGCTCACGC TGCTGGCGGC GCTGTCGCCG GCGGCCACCC CGGCGGCCAC GCTGGGCGCG 
CTGCTGGTCG CCCAGCGGCG CGGTTTCCCG GTCGCGGTCG CGGTGGCCGC GGCGGGGATC 
GTGGCCCACG CGGTGCAGGG CACATGGCGG CCGAACGGGG GGATCTCCTT CGGCTGGTGG 
CTGGTCCTGA TCACCGTCGG GTACGGCGCG CTGGTCGGCT GGGGCGCGCT GGCCCGGGCG 
CGCCACGCGC TCGTCGCCTC GCTGCGCGAA CGCGCCCGCC GCGCCGAGGC CGAGCAGGGC 
CGCCGGGTGG CCGAGGGCCG GATGCTCGAG CGGACCCGGA TCGCCCGGGA GATGCACGAC 
GTGCTGGCCC ATCGGCTGTC CCTGCTGGCG ACGTACGCGG GTGCGTTGGA GTACCGCCCG 
GACTCCCCGC CTGAGCAGCT CGCCCGTGCC GCGGGCGTGG TCCGCGCCGG AGCGCACCAG 
GCACTCGACG AGCTCCGGGA CGTGATCAAC CTGCTGCGCG ACGAGGACAC GGTCGAGGGC 
CACGAGCCCG ATGGACGGCC GCAGCCCGTG CTGGCCGACC TTCCCCGGCT GGTCGACGAG 
TCCCGCGACG CCGGAGGCCG GGTGCGGCTG CGCAACGAGG TGGTCGACCC GGACGCCCTG 
CCCGCCGCCG CCGGCCGGAC TGCCTACCGT GTCGTCCAGG AGGGGCTGAC CAACGCCCGC 
AAGCACGCCA CGGGCCGGCC GGTCCAGGTG ATGCTGGAGG GCCGGCCGGG TGCCCGGCTC 
GTGATCGACA TCCGCAACCC GCTGCCGGAG GACGGGGCCG CCACGTCGAT CACACCCGGC 
ACCGGCACCG GCCTGGTCGG GCTGACCGAG CGGGTGCAAC TCGCCGGGGG GCGGCTCGAC 
CACGAGGTGA CCGCCGGCGA GTTCCGCCTG CGCGCCTGGC TGCCGTGGCC GGCGTGA

Protein sequence

MNGDIHCGEG AGAARPRAPG TGIPAAVIMV VGMGALVALT IWGLSDAHPT GESLGRDIAA 
GVLGCVLSPV LLRWPVTGAL GLTLLAALSP AATPAATLGA LLVAQRRGFP VAVAVAAAGI 
VAHAVQGTWR PNGGISFGWW LVLITVGYGA LVGWGALARA RHALVASLRE RARRAEAEQG 
RRVAEGRMLE RTRIAREMHD VLAHRLSLLA TYAGALEYRP DSPPEQLARA AGVVRAGAHQ 
ALDELRDVIN LLRDEDTVEG HEPDGRPQPV LADLPRLVDE SRDAGGRVRL RNEVVDPDAL 
PAAAGRTAYR VVQEGLTNAR KHATGRPVQV MLEGRPGARL VIDIRNPLPE DGAATSITPG 
TGTGLVGLTE RVQLAGGRLD HEVTAGEFRL RAWLPWPA