Gene Cwoe_2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2140
Symbol
ID	8732583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	2249357
End bp	2250445
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	72%
IMG OID	646502758
Product	protein of unknown function DUF917
Protein accession	YP_003393940
Protein GI	284043600
COG category	[S] Function unknown
COG ID	[COG3535] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0447006
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCT GGCGGGTGGA AGAGGACGCG CTGGAGTCGA TCGTGATCGG CGCCGGCATC 
CTCGGGACCG GCGGCGGGGG CAACCCGTAC GTCGGCAAGC TGCGGGCGCG CAAGCTGCTG 
CGTGCGGGCC ACGAGATCGA GGTGATCGCG CTGGAGGACG TCCCCGACGA GTGGCGCCTC 
TGCACCGCGG GCGGCATGGG CGCGCCGACG ATCGCGGTCG AGAAGCTCCC CCGCGGCAGT 
GAGACGACCG ACGCGGTTCG CGCGCTCGAG GAGCACGTCG GGCACCGGAT CGACGCGATC 
CTGCCCGCGG AGATCGGCGG CGGCAACTCG ATCGAGCCGA TGATCATCGC CGCGACGCTC 
GGCATCCCGA TGGTCGACGC CGACGGGATG GGGCGCGCGT TTCCGACCCT CCCGATGATC 
ACGTACTTCA TCTACGGCGT CTCGCCGTTC CCGTGCGCCT TGGCGGACGA GAAGGGCAAC 
CAGATCGTCT ACCCGCGCGG CGTCGACGAC CACTGGCTGG AACGGCTGAC GCGCTCCAGC 
GCGGTGCAGA TGGGCGGCTT CGTCGGCTGC GCGGTGGCGT ACATGTCCGG CGCGGACGCC 
AAGCGCACGG CGATCGGCGG GACGCTGTCG TGGGCGCGCG CGCTCGGCGA CCGCGTCCGC 
CGCGCCCGCG CCGCCCGCGA CGAGGACGTG CTCGACGGGG TGCTCGAGGC GGCCGGCGGT 
CGCGTGCTGT TCGAGGGCAA GGTCGTCGAC GTCGAGCGGC GCAGCACCGA CGGCTTCGCG 
CGCGGCCAGC TCGTGCTCGA CGGGTTCGGC GGCGACGCCG GCGCGCAGCT GACGATCTCG 
TTCCAGAACG AGTACCTCGT CGCGTGGCGC GATGGCGAGG TTGTCGCGAC CGTGCCGGAC 
CTGATCTGCA TGGTCAACCG CGAGGACGGC GAGCCGATCA CGGTCGAGCG GCTGCGCTAC 
GGCTACCGCG TCGCGATCCT GGGTGTTCCG TGCTCGGAGC TGCTGCGCAC GCCCGAGGCG 
CTGGACGTCG TCGGCCCGCC GGCGTTCGGC TACGACCTTC CCTACGAGCC GATGGAGGTG 
GTCCGATGA

Protein sequence

MSSWRVEEDA LESIVIGAGI LGTGGGGNPY VGKLRARKLL RAGHEIEVIA LEDVPDEWRL 
CTAGGMGAPT IAVEKLPRGS ETTDAVRALE EHVGHRIDAI LPAEIGGGNS IEPMIIAATL 
GIPMVDADGM GRAFPTLPMI TYFIYGVSPF PCALADEKGN QIVYPRGVDD HWLERLTRSS 
AVQMGGFVGC AVAYMSGADA KRTAIGGTLS WARALGDRVR RARAARDEDV LDGVLEAAGG 
RVLFEGKVVD VERRSTDGFA RGQLVLDGFG GDAGAQLTIS FQNEYLVAWR DGEVVATVPD 
LICMVNREDG EPITVERLRY GYRVAILGVP CSELLRTPEA LDVVGPPAFG YDLPYEPMEV 
VR