Gene Gdia_2223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2223
Symbol
ID	6975652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2465439
End bp	2467034
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	65%
IMG OID	643391751
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_002276594
Protein GI	209544365
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.487572
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.417914
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA GCTGTGACTA TCTCGTCATC GGCGGGGGGT CGGCGGGCTG CGTCATGGCG 
GCGCTGCTGT CGGAAAATCC GGCGGCGCGC GTATGCATGA TCGAGGCCGG CGGCCCCGAT 
ACCAATCCCC TGATCCACAT CCCGATCGGC TTCGCCAAGA TGACGACGGG ACCGCTGACC 
TGGGGGCTGG CCACTGCGCC GCAGAAGCAC GCCAACAATC GTGAAATCCC TTATGTGCAG 
GCCAAGGTCC TGGGCGGTGG GTCCTCGATC AATGCCGAAG TCTTCACGCG CGGCGTTCCG 
TCGGATTATG ACCGCTGGGT GGAGGAAGGC GCCGAGGGCT GGGCCTTCAA GGACATCCAG 
AAATACCTGA TCCGGTCCGA GGGCAATACG GCGCTGTCGG GCGAATGGCA TGGCACGAAC 
GGCCCGCTGG GCGTGTCCAA CCCGACCTCG CCCAATCCGC TCAGCCTCGC CTTCGTGCAG 
AGCTGCCAGG AATACGGCAT TCCGTACAAT CCCGACTTCA ACGGCCCCAG GCAGGAAGGG 
GCCGGATTCT ACCAGTTGAC GGTCCGCAAC AGCCGGCGCT GCTCGGCGGC GGTCGGCTAT 
CTGCGTCCGG CGCGCAAGCG CGCCAACCTG CATGTCATCA CCAGGGCGCA GGTCCTGCGC 
ATCGCCTTCG AGGGCAAGCG CGCGAAGGGC GTCGTCTATG CGGTGGATGG CCAGGTCCGG 
GAAGTGCGGG CGGAACAGGA AGTCATCGTC ACCTCCGGCG CCATCGGCAC GCCGAAACTG 
CTGATGCTGT CGGGCATCGG GCCGGCCGCG CACCTGCAGG CCCATGACGT TCCGGTGGTG 
CATGACCTGC CGGGCGTCGG CCAGAACCTG CAGGACCATT TCGGCGTGGA TATCGTCGCC 
GAACTGAAAG ATCACGAAAG CTACAACCGG TACAACAAAT ATCACTGGGC GGCGTGGGCC 
GGCCTGCAAT ACGCGCTGTT CCGCTCGGGT CCGCTGGCGT CCAACGTCGT GGAAGGCGGC 
GCGTTCTGGT ATGCGGACCG CAACGCGCGC ACGCCCGACC TGCAATTCCA CTTCCTGGCC 
GGCGCGGGGG CGGAAGCCGG GGTGGTCTCG GTGCCGAAGG GCGCGTCCGG CATTACCCTC 
AACAGCTACA CGCTGCGCCC GAAATCGCGT GGCACGGTCA CGCTGCGGTC GTCCGACCCC 
CGGGACAACC CGATCGTCGA TCCGAACTTC CTGGCCGACC CCGACGACCT GCGCATCTCG 
GCCGAAGGCG TGAAGATCAG CGTGGAGATG TTCCGCCAAC CGTCGCTGCA GAAATACATC 
AAGTCGATCA ACCTGTTCGA CGAGATCCGG CCGACGGCCC GCACCTACGA GGACTACACC 
CGGCAGAACG GCCGGACATC CTATCACCCC ACCTGCACCT GCAAGATGGG CAAGGACCCG 
ATGGCGGTGG TCGATTCGCA GCTTCGCATC CACGGGCTGG ACGGCATCCG CATCTGCGAC 
AGCTCGGTCA TGCCGTCGCT GATCGGATCG AATACCAACG CGCCGACGAT CATGATCGCC 
GAGCGCGCCG CCGACCTGAT CCGGGGCAAT GCCTAG

Protein sequence

MTESCDYLVI GGGSAGCVMA ALLSENPAAR VCMIEAGGPD TNPLIHIPIG FAKMTTGPLT 
WGLATAPQKH ANNREIPYVQ AKVLGGGSSI NAEVFTRGVP SDYDRWVEEG AEGWAFKDIQ 
KYLIRSEGNT ALSGEWHGTN GPLGVSNPTS PNPLSLAFVQ SCQEYGIPYN PDFNGPRQEG 
AGFYQLTVRN SRRCSAAVGY LRPARKRANL HVITRAQVLR IAFEGKRAKG VVYAVDGQVR 
EVRAEQEVIV TSGAIGTPKL LMLSGIGPAA HLQAHDVPVV HDLPGVGQNL QDHFGVDIVA 
ELKDHESYNR YNKYHWAAWA GLQYALFRSG PLASNVVEGG AFWYADRNAR TPDLQFHFLA 
GAGAEAGVVS VPKGASGITL NSYTLRPKSR GTVTLRSSDP RDNPIVDPNF LADPDDLRIS 
AEGVKISVEM FRQPSLQKYI KSINLFDEIR PTARTYEDYT RQNGRTSYHP TCTCKMGKDP 
MAVVDSQLRI HGLDGIRICD SSVMPSLIGS NTNAPTIMIA ERAADLIRGN A