Gene Dshi_1428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1428
Symbol
ID	5712605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1483002
End bp	1484636
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	64%
IMG OID	641267341
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001532771
Protein GI	159043977
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGAC GCGATTTCCT GCGCCGTGCA ATGGCGCTGG GGGCGACCGC CGGCATGGCC 
GGTGCGCTCG CGACAGCCTG GTCCGGCACG GCAATCGCGC AGTCTTCGAC CACCGCGCCG 
CAGCCCGACG GGGAATACGA CTTCATCGTG ATCGGCACGG GCTCCGCCGG GGCCGCTTGC 
GTGTATCAAC TGGCTCAGAC AGGCGCGCGG ATCCTCGTGC TCGAAGCCGG GCGCAACGAC 
GACCTCGAAG AGGTCCATGA CAGCCGCCTG TGGGCTGCGT CCCTTGGCAC CGACGCCACG 
AAATGGTTCG AAACCCTGCC CTCCAGCCAT ACGGATGGAC GCAATCACAT GTGGCCGCGC 
GGCAATGTGT TGGGCGGGAC ATCTGCCTTG AACGCGATGG TCTATGCGCG CGGGCACAGG 
ACCGATTTCG ACGTCTGGGA GACGATGGGT GCCACCGGTT GGAGCTATGA AGACGTACTA 
CCGCATTTCA TGGCGATGGA AAGCTATGAG CCCGGGGGCG AGAACCGCGG CACCAGCGGC 
CCGATCTTTG TCAGCCAACC CCAGGACCCA CACCGCCACG AAGGGGCCGT CGCGTTCATG 
GATGCCGCGG CGGGGCTGGG ATACAAAGAA ACGCCGTCCT TCAACTCCGA TCGGATGTCC 
GGTCAGGCCT GGATCGATTT CAACATCAAG GACCAGCGGC GTCAGTCGTC TGCAGTCGCA 
TTCCTGCGCC CGGCGATCGA GAACGGCAAC ATCACGCTGC TGACCGATGC CCCGGTCCAG 
AAGCTGACCC TGGAGGGCAC GAAATGCACC GGGGTCACCT ACCTGCACAA CGGCGCGCCC 
GTCAGCGTCC GGGCGGCGAA CGAGGTGATC CTCTCGGCCG GGGCCATCGA CAGCCCCAGG 
CTGCTGATGC TGTCGGGGAT CGGCATCGCG TCCGACCTCA GGCAGGTCGG GATCGACGCC 
GTCGTCGACT TGCCGGTTGG TGTCGGGCTC CAGGACCACA TTCTCGGCGC AGGTGTGAAC 
TACGAAGCCA AGGGCCCCGT GCCGGTCAGC CATTACAACC ACTCCGAAGT CTACATGTGG 
GAACGATCGG ATCCGGGCCT GCGGTCACCC GACATGATCG CGCTCTATGT TTCGGTGCCC 
TTCGCCTCTA CCGGTCACAA GCTGGATTAC GAGCACGGCT ACTGCATTCT CTCGGGCGTC 
GCGACGCCGC AATCGCGCGG CTACGTCAAG CTGGCGTCTG ACGACATCGC GGATGCCCCG 
ATCATCGAGA CCAATTACCT GGCCGAGGAA CAGGATTGGA AGTCCTACCG TGCCGCGACC 
GAGCTGTGCC GCGAGTTGGG CGCCTCGGAC GCTTATGCCG AGTTCCGCAA GCGCGAGAGC 
CTGCCGCAGA AGGACGGGGA GCTGACGGAT GCCGAATGGC GCGACTTCCT CTCCGCGTCG 
GTCAACACCT ATTTCCACCC CACATCCACA TGCCAGATCG GCAAGGTGGT GGAGCCGGAT 
CTGCGCGTGA AAGGCATTGA GGGCCTGCGA GTTGCGGATG CGTCCGTCAT GCCGCAGATC 
ACCACCTCCA ACACCAACGC GCCGACCATG ATGATCGGTT GGCGCGCGGG TGACATGATC 
TCCAAAGCAA CCTAG

Protein sequence

MSRRDFLRRA MALGATAGMA GALATAWSGT AIAQSSTTAP QPDGEYDFIV IGTGSAGAAC 
VYQLAQTGAR ILVLEAGRND DLEEVHDSRL WAASLGTDAT KWFETLPSSH TDGRNHMWPR 
GNVLGGTSAL NAMVYARGHR TDFDVWETMG ATGWSYEDVL PHFMAMESYE PGGENRGTSG 
PIFVSQPQDP HRHEGAVAFM DAAAGLGYKE TPSFNSDRMS GQAWIDFNIK DQRRQSSAVA 
FLRPAIENGN ITLLTDAPVQ KLTLEGTKCT GVTYLHNGAP VSVRAANEVI LSAGAIDSPR 
LLMLSGIGIA SDLRQVGIDA VVDLPVGVGL QDHILGAGVN YEAKGPVPVS HYNHSEVYMW 
ERSDPGLRSP DMIALYVSVP FASTGHKLDY EHGYCILSGV ATPQSRGYVK LASDDIADAP 
IIETNYLAEE QDWKSYRAAT ELCRELGASD AYAEFRKRES LPQKDGELTD AEWRDFLSAS 
VNTYFHPTST CQIGKVVEPD LRVKGIEGLR VADASVMPQI TTSNTNAPTM MIGWRAGDMI 
SKAT