Gene Cwoe_1551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_1551
Symbol
ID	8731991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	1639945
End bp	1641543
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	77%
IMG OID	646502169
Product	RNA polymerase, sigma-24 subunit, ECF subfamily
Protein accession	YP_003393354
Protein GI	284043014
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.357255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.29633
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGCGT CTTCGATCCC AGCCACGGCA GGTGTTCCCC GGCAGAAGAG CCGGGCCTCC 
GTCGGCCCCC TGCTGCGGCT GCGCTCCGAC GAGCAGCTCG TCAAGCTCTT TCGCCAGGGC 
AACGAAGAGG CGTTCCGCGC GATCCACGAT CGCTACCGCG CACGCCTGTT CGCCTACACG 
CGCCAGATGC TGTCCGGCTC GAGGCAGGAC GCCGAGGACG CGCTGCAGGA CGTCTTCGTG 
CGCGCGTACG GCGCGCTGCG CGCCAACGAC CGCGAGGTCT CGCTGCGCGC CTGGCTCTAC 
CGCGTCGCGC ACAACCGCTG CATCGACGAG CTGCGACGGC CCGCGCCGCC GCCGCCTGAG 
ATGTTCGAGC AGATCCGGCC GCCGGCGAAC GACCCGATCG CCGAGACCGA GCAGCGCGAG 
TCGCTGCGGC GCCTGGTCGA GGACGTCAGG CGGCTGCCGG AGCAGCAGCG CTCCGCCCTC 
CTGATGCGCG AGATCGTCGG CATGTCGTAC GCCGACCTCG CCGCGGCGCT CGACGTGACC 
GTCCCGGCCG TCAAGTCGCT GCTGGTGCGC GCCCGCATGG GCCTCGCGCA GGCCGCGGAG 
GCGCGCGACA CCGCCTGCGT CGAGATCCGC GAGGAGCTGG TCGGCGCGCA CGACCGCGGG 
GTCCGCGCCA GCGGCCTCGC GCGGCGCCAC ATGCACGACT GTGCCGGCTG CCGCGCGTAC 
AAGAGAGAGC TGAAGTCGAT GCGCGAGCGC TTCGCCGCGC TGACGCCGGC GCTCGGGCCG 
TTCGCGCTGG TCGCGAAGCT GCTCGGCATC GGCGGCGGCG GCGCGGCCGC GGGCGGCACC 
GCAGCCGGCG GCGGGGCCGC CGCCGGCGGT GCGGCGGCGG TCGGCTACGG CGCGGCCGTC 
GGCGGCACCG TCAGCGCGGG CCACGTCGCG GCCGTCGTCG CGGCGGCGGT CGTCGGCGCC 
GGCGGCGCGG TCGAGGTCAA GCGCACGCTG AACCCGCCCC AGCAGTCCGC CAAGGGCGCG 
GCGATCGTGC AGGTCGAGAA GCCGCGTGAC CGGCCGACCT TCGCGGCCGC GGTCGCGGCG 
GACACGGCGC CGGCCGTCGC GGCGACGCCC GCCTCGTCGG CCTCCGCCTC GACAGACGCG 
CGTGGGACGG CGGAACCGGC GAAGGTCAAG GACGCGCGGC CGAGAGCCAC GGCGCCGGCG 
CGCGTCGTCG CGACCCCGCC CACGACCGCT CCGATCACGA CCGGCAACGG CAACGGCGGC 
GCTGAGGCGC CGGCCGACGA GACGCTCGAG GAGCCGGTCG TCGTCGACCC CGTCACGACG 
CCGCCGGCGG AGCCGACGAC CGGGAGCGGC GGCACTACGG GGACCGGCGG GACGACCGGC 
AGCGGTGGCA CGACCGGCAC CGGCGGGACC ACCACCGGCG GCACGACGAC CGCGCCACCG 
ACCGGCGGCA CGGCCGGGAC GGGCTCCGGC GCACCGCCGA CGACCGCGCC GACGACGCCG 
ACGACCGGGT CGACGCCCAC GACGCAGCCG CCCGCGACGC CGTCGTCGAC CGGCGGCGCC 
GGCACGACGC CGAGCAACAC GAACCCGCCG GCCCGCTGA

Protein sequence

MEASSIPATA GVPRQKSRAS VGPLLRLRSD EQLVKLFRQG NEEAFRAIHD RYRARLFAYT 
RQMLSGSRQD AEDALQDVFV RAYGALRAND REVSLRAWLY RVAHNRCIDE LRRPAPPPPE 
MFEQIRPPAN DPIAETEQRE SLRRLVEDVR RLPEQQRSAL LMREIVGMSY ADLAAALDVT 
VPAVKSLLVR ARMGLAQAAE ARDTACVEIR EELVGAHDRG VRASGLARRH MHDCAGCRAY 
KRELKSMRER FAALTPALGP FALVAKLLGI GGGGAAAGGT AAGGGAAAGG AAAVGYGAAV 
GGTVSAGHVA AVVAAAVVGA GGAVEVKRTL NPPQQSAKGA AIVQVEKPRD RPTFAAAVAA 
DTAPAVAATP ASSASASTDA RGTAEPAKVK DARPRATAPA RVVATPPTTA PITTGNGNGG 
AEAPADETLE EPVVVDPVTT PPAEPTTGSG GTTGTGGTTG SGGTTGTGGT TTGGTTTAPP 
TGGTAGTGSG APPTTAPTTP TTGSTPTTQP PATPSSTGGA GTTPSNTNPP AR