Gene Plav_3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_3001
Symbol
ID	5456233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	3201190
End bp	3202410
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	66%
IMG OID	640878588
Product	glycosyl transferase group 1
Protein accession	YP_001414265
Protein GI	154253441
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.469537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCTC CCGCGCATAG CGAAAATCCG CACGCCGTGC GCAAGGTGCT GCATGTGATG 
CGCCTGCCGA TGGGCGGGCT CTTCCGTCAT GTGCGGGATC TGGTGGCCGG ACAGCAGGCC 
GCGGGCATCG CGGCGGGCGT CATCTGCGCG GAACCGCCGG CGGATGATGG CGTCTCCGCG 
AGGCGGCTTG CCGAGCTTGC GCCGAAATGC GGCCTCGGTC TCCATGTCAT ACCGATGGGG 
CGGCTGCCGG GCGTCGGCGA TGCCGTCAAT ATTCGTGAAG TTCGGGCGCT GGCCGATTGG 
CTGAAGCCCG ATGTTCTTCA TGGCCACGGC GCCAAGGGCG GTATGCTTGC GCGCCTTGCG 
CCGCGCGACG GCGCCCGCGT CGTCCGTGTC TATACGCCTC ATGGCGGTTC GCTGCACTAC 
AATGCATTGA GCCCGCAGGG CTTCGTCTAT CACACGGCCG AACGCCTGAT GCGCCGCCGC 
ACGGATGGTC TCATCTTCGA ATCCGAATTC AGCCGCGCCG CCTATCTCGC CAAGATCGGC 
CGTCCGGGTG CGCCTACCGC CGTCATTCAC AACGGGCTGA CGGAAGACGA ATTCCTGCCG 
GTGCCTCATG GCGACATGGC TGCCGACTTT CTCTTCATCG GCGAACTTCG GATGCTGAAG 
GGCGTCTCCA CACTGATCGA AGCTGCTTCG ACATTTTCGC GCCCGGTGCA TATCCGTATC 
GTGGGCGCGG GGCCGGACCG CGCGCGTTTC GAGGAATTGG CGAAGACCGC CGGCTCCGCC 
GCCCGGTTCG AGTTCATGGG CGCGATGCCG GCGCGCGAAG CTTTCAGGCT CGGCCGCATT 
GCGGTCATGC CGTCCTGGAA TGAATCGCTT CCCTATGTCG CGCTCGAAAC CGCCGCTGCC 
GGTATCCCGC TCATCGCGAC GCGTGTCGGC GGCATGGCGG AAATCTTCGG CCCGGATGCG 
ACACGTCTCG TACCTGCGCA AAACGCTTCG GCGCTTGCCG CCGCCATGAT GGCTGCCCTT 
GCCGATCCCG AAGCGGCTGC AGCTTCCGCC GCTCGTCTGC GCGCACGCGT CATGACGCAT 
TTTTCGGCGA GCCAGATGGT CGAGGGTGTG AACGGATTTT ACGACCGCCT GCTCGAAGCG 
CGGAAGGCGC GGCTTCTCGC GCATACCGGG CGTTTGGCAG CAGCGCCTGT CGCGCCGGGC 
CTCACGGGTG CGGGGCAATA G

Protein sequence

MASPAHSENP HAVRKVLHVM RLPMGGLFRH VRDLVAGQQA AGIAAGVICA EPPADDGVSA 
RRLAELAPKC GLGLHVIPMG RLPGVGDAVN IREVRALADW LKPDVLHGHG AKGGMLARLA 
PRDGARVVRV YTPHGGSLHY NALSPQGFVY HTAERLMRRR TDGLIFESEF SRAAYLAKIG 
RPGAPTAVIH NGLTEDEFLP VPHGDMAADF LFIGELRMLK GVSTLIEAAS TFSRPVHIRI 
VGAGPDRARF EELAKTAGSA ARFEFMGAMP AREAFRLGRI AVMPSWNESL PYVALETAAA 
GIPLIATRVG GMAEIFGPDA TRLVPAQNAS ALAAAMMAAL ADPEAAAASA ARLRARVMTH 
FSASQMVEGV NGFYDRLLEA RKARLLAHTG RLAAAPVAPG LTGAGQ