Gene Cwoe_4683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_4683
Symbol
ID	8735149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4990073
End bp	4991176
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	67%
IMG OID	646505312
Product	RNA polymerase, sigma 70 subunit, RpoD subfamily
Protein accession	YP_003396471
Protein GI	284046131
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.256379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.534178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTAG CTGAACTTCA GGAACTCGAA GAGATCAAGG GCCTCGTCAA CCGCGGCACG 
CAGCTCGGCG TCCTGACGTA CGCCGAGATC GCGAGAGCGG TCAGCGAGCT CGATCTCGAC 
GAGTCGGACG TCGAGGACCT GCACGGCTTC CTCGAGAGAG CCGAGATCGA GCTCGTCGAG 
GAGATCGATC CGGCCACGAC GGCGAGCAAC CAGGTCGAAC GCGCGCCCGA CAGACGTCGC 
GGCCGCCGCG CGAGAACCGC GCTCGACCTC AAGCCCGACA TGACGACCGA TTCCCTTCAG 
CTGTTCCTGA AGGACATCGG CAAGGTGCGG CTGCTCACCG CCCAGGAGGA GGTCGACCTC 
GCGAAGCGGA TCGAGCGCGG CGACCTCGAC GCGAAGCAGA AGATGGTCGA GTCGAACCTT 
CGCCTCGTCG TCTCGATCGC GAAGAACTAC CGCAACCAGG GCCTGCCGTT CCTCGATCTG 
ATCCAGGAGG GCACGCTCGG CCTCGTGCGC GCCGCGGAGA AGTTCGACTA CCGCAAGGGC 
TTCAAGTTCT CGACCTACGC GACCTGGTGG ATCCGCCAGG CGATCGCGCG TGCGCTCGCC 
GACAAGGCGC GCACGATCCG CATCCCGGTC CACGTCGTCG AGAAGCTGAA CAAGATCGGC 
CGTGCCGAGC GCAAGCTCGT CACGGAGTTG GGCCGCGAGC CCACCGCCGA GGAGATCGCC 
GACGTGACGG GGATCGACCC GGAGGAGGTC GACTCGATCA AGCGCTCCGC GCAGGCGCCG 
GTCTCGCTGG AGAAGCCGGT CGGCGACGAG GAGGAGTCCG AGTTCGGCCA GTTCATCGCC 
GACGAGCGCG CGGAGTCTCC CTACGAGCGG GCTGCCGAGA TCCTCACGAA GGAAGCCCTT 
CGCGAGGCGC TCGAGAACCT CTCCTACCGC GAGCGCCGCG TGCTGGAGTT GCGCTACGGC 
CTCGGCGGCG AGCATCCGCG CACGCTCGAC GAGGTCGGCC GCACGTTCAA CGTCACGCGC 
GAGCGGATCC GCCAGATCGA GAACCAGTCG CTCAAGAAGC TGCAGTCGCT CGCGGAGGCG 
CAGAAGCTCC GCGACGTCGC GTAG

Protein sequence

MSVAELQELE EIKGLVNRGT QLGVLTYAEI ARAVSELDLD ESDVEDLHGF LERAEIELVE 
EIDPATTASN QVERAPDRRR GRRARTALDL KPDMTTDSLQ LFLKDIGKVR LLTAQEEVDL 
AKRIERGDLD AKQKMVESNL RLVVSIAKNY RNQGLPFLDL IQEGTLGLVR AAEKFDYRKG 
FKFSTYATWW IRQAIARALA DKARTIRIPV HVVEKLNKIG RAERKLVTEL GREPTAEEIA 
DVTGIDPEEV DSIKRSAQAP VSLEKPVGDE EESEFGQFIA DERAESPYER AAEILTKEAL 
REALENLSYR ERRVLELRYG LGGEHPRTLD EVGRTFNVTR ERIRQIENQS LKKLQSLAEA 
QKLRDVA