Gene Plav_2644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2644
Symbol
ID	5456666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	2847636
End bp	2849360
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	59%
IMG OID	640878221
Product	choline dehydrogenase
Protein accession	YP_001413909
Protein GI	154253085
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID	[TIGR01810] choline dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.3131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.995844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCCGC ACAGGCATCA GACGTCGCGG CGGGCGGTAC CGCGAACGGC AAAACAACAA 
ATAACTGGAA ACAAGCGTAT GAGCGATTTC GACTACATCA TCATCGGTGC CGGCAGCGCG 
GGATGCGTGC TGGCGAACCG CCTGTCGGAG AACCCGGCGA ACAAGGTGCT GCTGCTCGAA 
GCAGGCTCGA AAGATTCCAA TTTCATGATT CACATGCCGG CAGGCGTCGG CAAGCTGATC 
GGCACGGATC TCGCCAACTG GTGCTACGAC ACGGAAGGCC AGCCCCACCT GAACAACCGC 
AAGCTCTATT GGCCGCGCGG CAAGGTTCTC GGCGGGTCGT CCTCTATCAA CGGCATGATC 
TATATTCGCG GTCATGCGCG CGATTACGAC ATGTGGCGTC AGCTTGGTCT GGAAGGGTGG 
GGCTTCTCCG ATGTTCTGCC CTATTTCCGC CGGTCGGAGG GCAATGAGAA CGGCAACAGC 
GCCTTTCATG GCGGCGAAGG CCCGCTCGGC GTCAGCAATC CGCGCAAGAC CAATGTGCTC 
TTCGAGTCCT TTGTCGAAGC GGGCAAGCAG GCGGGGCATC CCTATACGGA AGATTTCAAC 
GGGCCGCAGC AGGAAGGCGT CGGTCCTTAC CAGCTCACGA TCAAGAACGG TCAGCGCTGC 
AGCGCCGCCA AGGGTTATCT CGTGCCGGCC CTCAACCGTC CGAACCTCAA GATCGAGGTT 
GAAGCGCTTA CTTCACGCGT GATCTTCGAA GGCAAGAAGG CAGTCGGCGT CGAATATACG 
CAGAAGGGCG AAACGAAAGT CGCACGTGCG GCGAAGGAAA TCGTCGTCTC CGGCGGTGCG 
GTCAACACGC CGCAAATCCT CATGCTTTCG GGCATCGGCA AGGGCGAGTA TCTGCGCAAG 
TTCGGCCTCG ACGTGGTCGC GGACCTACCG GGCGTCGGCC AGAACCTGCA GGACCATCTT 
GATTGCGTCG TCATCAACGA ATGCACGCAG CCGATCACAC TGCACAGCAC GGTCAGCAAT 
CCGCTGAAGC AGCTGATGAG CGGCATGCAG TACACCTTCT TCAAAACCGG CCTTGCGACG 
TCGAACGGTC TTGAATCCGG CGCTTTCCTG AAGACGCGGC CGGAGCTCGA AATTCCCGAT 
ATCCAGCTTC ACTTCGTGGC CGCAATGATG CGCGATCATG CGCGGATAAA ATCTGATCGT 
CACGGGTTCA CGGTGCACAT CTGTCAACTT CGACCGGAAA GCCGTGGCTA TATCGGCCTC 
AAATCGACCA ACCCGTCCGA TTATGCGCTG ATCCAGCCGA ATTATCTGGC GGCCGAATAC 
GACCGCAAGG TGATGCGCGA CGGTGTGAAA ATGGTGCGCA ATATTATTTC GCAGCGCGCG 
ATGGACCCCT ATCGCGGGCC GGAGTTCTGG CCGGGTGCGG GCAAGCAGTC GGACGCGGAA 
ATCGATGCGT GGATCCGCGA AACCGCGGAG ACAATCTATC ATCCGGTCGG CACCGCCAAG 
ATGGGCACGG ACCCGATGGC TGTGGTCGAC GCGAAATGCC GCGTTCATGG GCTCCAAGGG 
CTCCGTGTCG TCGATGCCTC CGTGATGCCG ACACTGGTTG GGGGCAACAC CAATGCTCCG 
ACGATCATGA TCGCGGAAAA AATTTCCGAT GACATGCTCG GCAAGGCGCC ACTGCCGGCC 
GAAAATGTGA CGATTGCGGA AGACCGTATC GGCAACGCAG CCTGA

Protein sequence

MLPHRHQTSR RAVPRTAKQQ ITGNKRMSDF DYIIIGAGSA GCVLANRLSE NPANKVLLLE 
AGSKDSNFMI HMPAGVGKLI GTDLANWCYD TEGQPHLNNR KLYWPRGKVL GGSSSINGMI 
YIRGHARDYD MWRQLGLEGW GFSDVLPYFR RSEGNENGNS AFHGGEGPLG VSNPRKTNVL 
FESFVEAGKQ AGHPYTEDFN GPQQEGVGPY QLTIKNGQRC SAAKGYLVPA LNRPNLKIEV 
EALTSRVIFE GKKAVGVEYT QKGETKVARA AKEIVVSGGA VNTPQILMLS GIGKGEYLRK 
FGLDVVADLP GVGQNLQDHL DCVVINECTQ PITLHSTVSN PLKQLMSGMQ YTFFKTGLAT 
SNGLESGAFL KTRPELEIPD IQLHFVAAMM RDHARIKSDR HGFTVHICQL RPESRGYIGL 
KSTNPSDYAL IQPNYLAAEY DRKVMRDGVK MVRNIISQRA MDPYRGPEFW PGAGKQSDAE 
IDAWIRETAE TIYHPVGTAK MGTDPMAVVD AKCRVHGLQG LRVVDASVMP TLVGGNTNAP 
TIMIAEKISD DMLGKAPLPA ENVTIAEDRI GNAA