Gene Acid345_0361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0361
Symbol
ID	4069603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	400022
End bp	401692
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	59%
IMG OID	637982364
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_589440
Protein GI	94967392
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.252753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGATG ACCAGCGGCA GTTTGATTTC GACTTCATCG TCATCGGCTC AGGATTTGGC 
GGAAGTGTCT CCGCGCTGCG ACTCACGGAA AAGGGCTACA AGGTCGCAGT GATGGAGATG 
GGGCGTCGCT GGACGCCCGA CAACCTTCCG AAGACCAATT GGTCGCTCGC GCGCTGGTTC 
TGGCGACCGG GGCTCGGGCT GCGCGGCTTC TTCAGCATGA GGTTTTTCAG TCGCGTCACA 
ATCTTGCATG GATGCGCGGT GGGCGGCGGC TCCATCACCT ATGCCAGCAC GCTGCTGCGT 
GCGCCGGATA AAGTATGGGA CAGCGGCACC TGGAAGGGAC TGTCGAATTG GAAGTCGGAG 
ATGCCGCGCC ACTACGAGAC GGCGTCGCGC ATGCTCGGTG TTACTCAGAA CAAGATCCTC 
GGGCCCGCCG ATCATCTGCT GAAGCAAGTT GCCGTCGCCT CCGGAGCAGG CGAGACGTTT 
TACCGCACCA ACGTCGGCAT TTTCCAGGCG CCCGAAGGCG AAGCTGGTGG ACTGACCTAT 
GCCGATCCGT ACTTCGGTGG CGAAGGTCCA GCGCGCACCA CCTGCAACGC CTGTGGTGGC 
TGCATGATCG GTTGCCGTCA CGGCGCGAAG AACACGCTCG ATCTTAACTA TCTCTACCTC 
GCTGAGAAGC GCGGTATGAA GATCTTCGCG GAGACGCGTG TGGTGGACGT TCAGCCGCTT 
GGCGCGGTGG ATGGCAGAGA AGGGTACGAA GTCACTACTG AACGCTCGAC CTCATTCGTG 
TTCAAGAACC GGCAACGCTT CACGTGTCGG GGTATTGTGT TCTCGGCATC GTCACTCGGT 
ACGACGGAGC TTCTCTTCCG CCTGAAGACG AAGCATTCGC TGCCAAACAT CAGCGATCAG 
CTCGGCAATC GTGTGCGTAC GAATAGCGAA TCACTCATCG GAGTGCGGGT GCCGAAATCC 
GAGCAAGATC TTTCTCGCGG GGTTGCGATC GGTTCGGGCG TTTACATCGA CGACCACACG 
CACATTGAAG CCGTGCGTTA TCCCAAAGGT TCCGATGTCA TGGGCGGCCT TGCAACCACT 
CTTACTGCGG GCAAGCCTGG CATTGGACGC ATTGCGCTCT GGTTCAAGAA CTTGCTGGTC 
TCATTCTGCA CGCATCCGGT GCGCACCGTT CGACTGCTTC AGCCCTTCGG TTTCGCGCGC 
GAATCCGTCA TCCTGCTCTG CATGCAGGCG CTGGAGGGAC ACATTGATAT GCGGTGGAAA 
CGTCCCTGGT ATTGGCCTGT TCGCCGCGTG CTCGTCAGCA GCGGACAGCG CATCCCAACC 
TTCATTCCTG CGGCCAATCA GTTCGCGCAG GTATTCGCCA AGATGGCGGG TGGCACCGCG 
ATGAGTATGT TGCCGGAGAT TCTCTTCAAT ATTCCCGCGA CCGCCCATTG CCTCGGTGGC 
GCTGTAATCG GCGCATCGCC GGTGGACGGC GTGATTGACG CGCGGCACCG CGTCTTTGGC 
TACACCAATA TGTATGTTTG CGATGGCTCT GTCGTTGCCG CAAACCTCGG CGTCAATCCC 
AGCCTGACGA TTACGGCGTT GGCGGAGCGC GCGATGGAGT TCATTCCACT CGCGAGCGCG 
CATACGTGGA CCGATCGCGC TGATTCCATC GAAGTCTCTA AAGCTGTCTA G

Protein sequence

MQDDQRQFDF DFIVIGSGFG GSVSALRLTE KGYKVAVMEM GRRWTPDNLP KTNWSLARWF 
WRPGLGLRGF FSMRFFSRVT ILHGCAVGGG SITYASTLLR APDKVWDSGT WKGLSNWKSE 
MPRHYETASR MLGVTQNKIL GPADHLLKQV AVASGAGETF YRTNVGIFQA PEGEAGGLTY 
ADPYFGGEGP ARTTCNACGG CMIGCRHGAK NTLDLNYLYL AEKRGMKIFA ETRVVDVQPL 
GAVDGREGYE VTTERSTSFV FKNRQRFTCR GIVFSASSLG TTELLFRLKT KHSLPNISDQ 
LGNRVRTNSE SLIGVRVPKS EQDLSRGVAI GSGVYIDDHT HIEAVRYPKG SDVMGGLATT 
LTAGKPGIGR IALWFKNLLV SFCTHPVRTV RLLQPFGFAR ESVILLCMQA LEGHIDMRWK 
RPWYWPVRRV LVSSGQRIPT FIPAANQFAQ VFAKMAGGTA MSMLPEILFN IPATAHCLGG 
AVIGASPVDG VIDARHRVFG YTNMYVCDGS VVAANLGVNP SLTITALAER AMEFIPLASA 
HTWTDRADSI EVSKAV