Gene Plav_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_1024
Symbol
ID	5454124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	1122701
End bp	1124116
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	59%
IMG OID	640876594
Product	aldehyde dehydrogenase
Protein accession	YP_001412303
Protein GI	154251479
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.736803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTCC ACGATGACTA TGTGATGACC ATCGACGGTA CGGCTGTGGC GAGTGAAGCG 
ACGATCGATG TGGTCAATCC CGCGACTGGC AAGCCCTTCG CTTTCGCTCC CGACTGTTCG 
AAAGCACAGC TGGATGCGGC GGTGGCCGCC GCCGGCAGCG CCTTCAAAAA CTGGCGGCGC 
ACGCCGATTG CGGAGCGTCA GGCCATGGTG GCGAAGGCCG GCGACCTGCT GGTTGCCCAT 
GCCGATGAAA TGGCCCGCCT TTTCACGCGC GAGCAAGGTC GGCCCGTAGA GCTGGCAAAG 
CGGGAGATTG TGGGCGCGGG AATGTGGATG ACGGCGGTTG CCGAGATGAC CCCACCCGTG 
CACGTGTCCG AAGACAGCGA CAAGCAATTC ATCGAAACCC GCTATGTGCC GCTCGGCGTG 
ATCTGTGCCC TTGCGCCGTG GAATTTTCCG GTCAACCTCG CCATGTGGAA GGTCGCTCCT 
GCGCTGGTTG CAGGCAATAC CATGGTACTG AAGCCCAGTC CCTTCACCCC GCTATGCACT 
CTGAAGATCG GTGAGCTTTT TGCCGACGTT TTTCCCGCCG GTGTGTTCAA CGTAATCAGC 
GGCGGCGATG AGCTTGGTCC GATGATGACC CGCCACCCCG GCTTCGCCAA GATCAGCTTC 
ACTGGCTCAA CCGCCACGGG CAAGCGGGTG ATGGAAAGCG CAGCCAGGGA TCTGAAGCGC 
GTGACGCTGG AATTGGGTGG CAACGACGCT GCAATTGTAC TTCCCGACGT GGATCTGGAT 
GCTGTGGCCC AGAACATATT TCTCGGTGCT TTCCTAAACA CGTCCCAGAT ATGCGTAGCA 
ACCAAGCGGC TCTACGTGCA CGAAGACATA TATGACGGGC TGCGGGATCG ACTGGTCGCT 
ATTGCCCGTA CAACCAAGGT GGGCGACGGT GCCGAGCAGG GTACAGTGCT GGGGCCGATC 
CAGAACAAGC GTCAGTACGA TCGTGTAGTT GCATTGTTGG AAGACGCAAA AGCCAACCGA 
CTGACTCTGA TCCACGGCGC AGCTATTCCC GAAAGCGATG GATATTTTGT CCCTGTCACC 
ATCGTAGACA ACCCACCGGA AGATTCCCGC GTTGTGCAGG AGGAGGCGTT CGGCCCAATC 
TTGCCGATGC TGAAATTCTC CGACATCGAC GATGTGATTG ATCGAGCCAA CGCCAGCGAA 
TATGGCCTCG GCGGGCAGGT GTGGTCTGCA GATACGGACA AGGCCATTGA GATTGCACGG 
CGCCTGGAAA CGGGAACGGT CTGGGTGAAT CAAATGCTCA ATCTGCGCGC CGATACTCCC 
TTCGGCGGAC ATAAGCAGAG CGGCTTTGGT GTCGAGAACG GTATGGAGGG CCTACTTGAA 
TATATGGTGC CCCAAGCGGT TTACGTGGCC CGGTAG

Protein sequence

MNFHDDYVMT IDGTAVASEA TIDVVNPATG KPFAFAPDCS KAQLDAAVAA AGSAFKNWRR 
TPIAERQAMV AKAGDLLVAH ADEMARLFTR EQGRPVELAK REIVGAGMWM TAVAEMTPPV 
HVSEDSDKQF IETRYVPLGV ICALAPWNFP VNLAMWKVAP ALVAGNTMVL KPSPFTPLCT 
LKIGELFADV FPAGVFNVIS GGDELGPMMT RHPGFAKISF TGSTATGKRV MESAARDLKR 
VTLELGGNDA AIVLPDVDLD AVAQNIFLGA FLNTSQICVA TKRLYVHEDI YDGLRDRLVA 
IARTTKVGDG AEQGTVLGPI QNKRQYDRVV ALLEDAKANR LTLIHGAAIP ESDGYFVPVT 
IVDNPPEDSR VVQEEAFGPI LPMLKFSDID DVIDRANASE YGLGGQVWSA DTDKAIEIAR 
RLETGTVWVN QMLNLRADTP FGGHKQSGFG VENGMEGLLE YMVPQAVYVA R