Gene Ksed_20590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_20590
Symbol
ID	8373563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	-
Start bp	2137686
End bp	2138708
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	66%
IMG OID	644992308
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_003149818
Protein GI	256825858
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.556688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGATTG CCCAGCGCCC CACCCTCTCC GAGGAGAAGG TCTCCGAGGC CCGTTCCCGG 
TTCACCATCG AGCCGCTGGA GCCCGGCTTC GGCTACACCC TCGGCAACTC GCTCCGCCGC 
ACCCTGCTCT CGAGCATCCC GGGTGCCGCG GTCACCAGCA TCCGCATCGA CGGTGTGCTG 
CACGAGTTCT CCACCGTTCC CGGTGTGAAG GAGGACGTCA CCGAGCTCAT CCTCAACATC 
AAGTCCCTCG TCTTCTCCTC GGAGCACGAC GAGCCCGTGG TGGCCTACCT GCGCAAGCAG 
GGTTCGGGTG AGATGACCGG TGCCGACATC AGCTGCCCGG CAGGTGTCGA GGTGCACAAC 
CCCGACCTCT ACCTGGGTGC GCTGAACGAC GAGGGTGCGA TCGACCTCGA GCTCACCATC 
GAGCGTGGCC GCGGCTACGT CTCGGCGCAG CAGAACAAGG GCGGCGAGCA GGAGATCGGC 
CGGATCCCGG TCGACTCCAT CTACTCGCCG GTGCTGTCGG TCACCTACAA GGTGGAGGCC 
ACCCGTGTCG AGCAGCGCAC CGACTTCGAC AAGCTGATCG TCGACGTCGA GACCAAGAAC 
TCCATGTCCC CGGCCGATGC CATGGCCTCG GCCGGCAAGA CGCTGGTGGA GCTCTTCGGT 
CTGGCGCGCG ATCTCAACGT CGAGGCCGAG GGCATCGAGA TGGGCACCGT GCAGACGGAC 
GCCTCGCTGG CCGCCGACCT GGCGTTGCCG GTGGAGGAGC TCAACCTGTC CGTGCGTTCC 
TACAACTGCC TGAAGCGCGA GGGCATCCAC ACCGTGGGTG AGCTCGTGGC ACGCAGCCAG 
GCGGACCTGC TGGACATCCG CAACTTCGGC AACAAGTCCA TCGACGAGGT GCAGGTCGAG 
CTCCACAAGC TCGGTCTGGC CCTCAAGGAC ACGCCGGCCG ACTTCGACCC GTCCACCATC 
GTGCTCGACC GCGACGAGGA CGAGGCCGCC GACGACGAGG TCCTCGAGGA CGAGCAGTAC 
TGA

Protein sequence

MLIAQRPTLS EEKVSEARSR FTIEPLEPGF GYTLGNSLRR TLLSSIPGAA VTSIRIDGVL 
HEFSTVPGVK EDVTELILNI KSLVFSSEHD EPVVAYLRKQ GSGEMTGADI SCPAGVEVHN 
PDLYLGALND EGAIDLELTI ERGRGYVSAQ QNKGGEQEIG RIPVDSIYSP VLSVTYKVEA 
TRVEQRTDFD KLIVDVETKN SMSPADAMAS AGKTLVELFG LARDLNVEAE GIEMGTVQTD 
ASLAADLALP VEELNLSVRS YNCLKREGIH TVGELVARSQ ADLLDIRNFG NKSIDEVQVE 
LHKLGLALKD TPADFDPSTI VLDRDEDEAA DDEVLEDEQY