Gene Plav_1096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_1096
Symbol
ID	5456690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	1201654
End bp	1203048
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	65%
IMG OID	640876666
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001412374
Protein GI	154251550
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3200] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01358] 3-deoxy-7-phosphoheptulonate synthase, class II

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.966899
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATA CCTGGAAACC GGAGAGCTGG CGCGCCAAAC CCGCGAAGCA TCTCCCGAGC 
TACCCGGATG AAGCGGCTCT GGCCGCCGTG GAAGCGCGCC TGCGCTCCTA TCCGCCGCTC 
GTTTTTGCAG GTGAGGCCCG CAAGCTGAAG GCCGACCTCG CCGAGGTCTG CGAGGGCCGT 
GCATTCCTCC TCCAGGGCGG TGATTGCGCC GAAAGCTTCG CCGAATTCTC CGCCGACAAT 
ATCCGCGACA CCTTCCGCGT GCTGCTGCAG ATGGCGGTTG TGCTCACCTT CGCCGCCGCC 
TCGCCGGTCG TGAAGGTCGG CCGCATCGCC GGCCAGTTCG CGAAGCCGCG TTCGTCCGCC 
ACCGAAACCA TCGGCGACGT GACGCTGCCG TCCTATCTCG GCGACAACAT CAACGGTATC 
GAGTTCGACG AGAAATCGCG CGTGCCCGAT CCCGAAAGGC TGCTCCGCGC CTATTCGCAA 
TCGGCCTCGA CGCTGAATCT CATTCGCGCC TTCGCGAATG GCGGCTATGC CGATCTCGAT 
TTCGTGCATC GCTGGAATCT GGGCTTCGTC TCCGACAGCG CCGAAGGTGC GCGCTACGAG 
GAACTGGCGA ACCGCATCAC GGAAGCGCTC GATTTCATGC GCGCCTGTGG CATCGACAGC 
GCCACGCAGC CCCAGCTTCA CACGACGGAT TTCTACACCA GCCACGAGGC CCTGCTGCTC 
GGCTACGAAC AGGCGATGAC GCGCATCGAC AGCACGACGG GCGATTGGTA CGACACCTCC 
GCCCACATGC TCTGGATCGG CGACCGCACG CGCCAGCCCG ATCACGGCCA TGTCGAATAC 
ATGCGTGGCA TCAAGAACCC GATCGGCATG AAATGCGGCC CCTCCCTCGA TCCCGAGGAG 
CTTGTGCGTC TCACCGACAT TCTCAATCCG AAGAACGAGC CGGGCCGCTT GACGCTCATC 
TGCCGCTTCG GCGCCGAGAA TGTCGAGAAG CACCTGCCGC AGCTCATCCG CGCCATCGAG 
CGCGAGGGCA AGAAGGTGGT CTGGTCCTGC GACCCGATGC ACGGCAACAC CATCAAGGCG 
TCGTCCGGCT ACAAGACGCG GCCCGTGGAC CGCATCCTCG CCGAAGTACA GGCCTTCATG 
GCCGTGCACC GCGCCGAAGG CACCCATGCC GGCGGCGTCC ATTTCGAAAT GACCGGCCAG 
AACGTCACCG AATGCATCGG CGGCGCGCAG GCGATTTCGG AAACGCAACT CGGCGACCGC 
TACCACACGC ATTGCGACCC GCGCCTCAAC GCCAGCCAGT CGCTGGAACT CGCCTTCCTC 
ATCGCGGAAG GCCTGAAGAA GGAGCGCCTG GAAGCCCTGC GCGCCGAACC CGTCGCCGCC 
CTCGGCGCCT GGTAA

Protein sequence

MADTWKPESW RAKPAKHLPS YPDEAALAAV EARLRSYPPL VFAGEARKLK ADLAEVCEGR 
AFLLQGGDCA ESFAEFSADN IRDTFRVLLQ MAVVLTFAAA SPVVKVGRIA GQFAKPRSSA 
TETIGDVTLP SYLGDNINGI EFDEKSRVPD PERLLRAYSQ SASTLNLIRA FANGGYADLD 
FVHRWNLGFV SDSAEGARYE ELANRITEAL DFMRACGIDS ATQPQLHTTD FYTSHEALLL 
GYEQAMTRID STTGDWYDTS AHMLWIGDRT RQPDHGHVEY MRGIKNPIGM KCGPSLDPEE 
LVRLTDILNP KNEPGRLTLI CRFGAENVEK HLPQLIRAIE REGKKVVWSC DPMHGNTIKA 
SSGYKTRPVD RILAEVQAFM AVHRAEGTHA GGVHFEMTGQ NVTECIGGAQ AISETQLGDR 
YHTHCDPRLN ASQSLELAFL IAEGLKKERL EALRAEPVAA LGAW