Gene Cwoe_4256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_4256
Symbol
ID	8734718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4522228
End bp	4523283
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	646504882
Product	NMT1/THI5 like domain protein
Protein accession	YP_003396045
Protein GI	284045705
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0797632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.637243
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACAGC TGAGGACGAC GTGGCGCCAG CTCACCCTTG CGATTGCGAC TGTCGCGTTG 
GTCGCGACGT TCGCCGCCTG CGGTGGCAGC GACTCTGGGG GGACCGCCGA CAACGTCAGA 
ACGACGTCTG GTGGCGAGCT CGCCGAGATG ACCAAGGCGA CGCTCGTGCT CGACTTCGTT 
CCCAACGCCG TCCACGCGGG CATCTACCGG GCATTGGCAG CCGGCTACTA CAGAGACCAC 
AACATCGATC TGCGCGTGAT CCAGCCGACC TCGACCGCTG ACACGCTGCG CCTCATCAAC 
GCGAACAAGG CCGACTTCGG CCTCGCGGAC GGCCTCGACG TCGCCAACCA GATCGGCGAG 
GGGCTCGACA TCGAGGCGTT CCTGGGGATC GTCCAGCGGC CGCTCGGCGG CGTCATCACG 
CTGGAGAGAG ACAACATCGC CTCCGGCAAG GACTTCGAGG GCAAGACCGT CGGCGTCACC 
GGCGTGCCGT CCGACAACGC AACGCTCGAC ACCGTCGTCA GAAACGACGG CGGCGACCCG 
TCGAAGGTGA AGGTCGTCAC GATCGGCTTC AACGGCGTGC AGAACCTCCA GAACGGCAAG 
GTCGCCGGCT TCATCGGCTT CTGGCCCTCC GACGGCGTCC AGCTCGACGT CGACGGCTTC 
CCGACCAAGA GCTTCAAGCT CGACGAGAAC GGCGGACCGG TCTACCCGGG CCTCGTCGCC 
TTCTCGACCC AAAAGCACAT CCAGCAGGAC CCGGCGCTGA TAAGAGCGTT CACGGCCGCG 
ACGGTCCAGG GCTACGAGGA CACGATCAGA GACCCGCAGC AGTCGCTGGC GGACCTCCTG 
TCGGAGAACA AGTCGCTCAG AAGAGACCTG ACGGCCGCGC AGCTGAGAGC GTTCGAGCCG 
CTGTTCCAGG GCGACGCCGC GCGCTTCGGC ACGCTCGACC CGAGAAACGT CGAGGCGCTC 
TCGAGCTGGA TGGTCGACAA CAGACTCGCG AGAGAGCCGT TCACGCCGGA GCGCTACGGC 
GGCGACAGAT ATCTCCCTGC GGCCGGCGGA TCATGA

Protein sequence

MRQLRTTWRQ LTLAIATVAL VATFAACGGS DSGGTADNVR TTSGGELAEM TKATLVLDFV 
PNAVHAGIYR ALAAGYYRDH NIDLRVIQPT STADTLRLIN ANKADFGLAD GLDVANQIGE 
GLDIEAFLGI VQRPLGGVIT LERDNIASGK DFEGKTVGVT GVPSDNATLD TVVRNDGGDP 
SKVKVVTIGF NGVQNLQNGK VAGFIGFWPS DGVQLDVDGF PTKSFKLDEN GGPVYPGLVA 
FSTQKHIQQD PALIRAFTAA TVQGYEDTIR DPQQSLADLL SENKSLRRDL TAAQLRAFEP 
LFQGDAARFG TLDPRNVEAL SSWMVDNRLA REPFTPERYG GDRYLPAAGG S