Gene Plav_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_0903
Symbol
ID	5454730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	974469
End bp	975644
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	67%
IMG OID	640876474
Product	HK97 family phage portal protein
Protein accession	YP_001412183
Protein GI	154251359
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.580107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATC CGTTGACGTC GCTGGCGCGG CTGGTGCGGC CGCGTGAGGC GAAGCACTCG 
CGCGTGGCGC CGGTGATTGC GTTGCATATG CAGGGGAGGG CCGTGTGGAC GCCGCGGGAT 
TATGCGCCGC TGGCGGAGGA GGGCTATCAG CGGAACGCAA TTGCCTATCG CTGCGTGCGG 
ATGATTGCCG AGGCGGCGGC GAGTGTGCCC TGGCTGCTTT ATGACGGGGC GCGGGAGCTG 
AGCGAGCATC CGCTGCTGCG GCTGATCGAA AGCCCGAACA GGGGGCAGGC GGGGGCGGAG 
CTTTTCGAGA CCTGGTACAG CTACCTGCAG GTGGCGGGGA ATGCCTATCT CGAACTTGTG 
GAGGTGGACG GGGCCCCGCG CGAGCTTTAT GCGCTGAGGC CAGACCGCAT GAAGGCGGTG 
CCGGGGCGGG CGGGCTGGCC GGAGGCTTAC GAATATTCCG TGAACGGACG GAGCGTGACT 
ATTCCCTGCG GCGAGCGGAG CCCGGTGCTG CATATGCGGC TCTTCCACCC TTCCGACGAT 
CATTATGGCT TGAGCCCGCT GGAAGCGGCG GCCTATGCCA TCGACATTCA CAATGCGGCC 
GGCGCCTGGA ACAAGGCGCT GCTCGACAAT GCGGCGCGGC CTTCCGGCGC GCTGGTCTAC 
AAGGGCGGCG AGGCGGGCGC GAACCTCACC GAAGATCAGT TCGAGCGGCT GAAGCGGGAG 
CTGGCGGAAA ATTATCAGGG CGCGGCCAAT GCCGGGCGGC CGCTGCTGCT GGAAGGCGGA 
CTCGACTGGC AGAGCATGGG GCTTTCGCCG AAGGATATGG ACTTCATCGA GGCGAAGCGG 
ACGGCGGCGC GGGAAATCGC GCTCGCTTTC GGCGTGCCGC CGATGCTGCT CGGCATTCCG 
GGCGACAATA CCTATTCCAA TTACCGCGAG GCGAACCGGG CCTTCTGGCG CGGCACCGTG 
CTGCCGCTGG TCGGCCGCTC GGCACGCGCG CTGACGCATT GGCTGGCACC CCGCTATGAG 
GGGAAGCTCA GGCTCTGGTA TGACGCCGAC CAGGTGGAGG CGCTGGCCGC CGACCGCGAC 
GCGCTGTGGG CGCGGGTGGG CGCGGCCGAT TTCCTCAGCG ACGAGGAAAA GCGCGAGGCA 
GTGGGCTATG GCAAGGTCAA AGCGTCTTCG ACTTGA

Protein sequence

MPNPLTSLAR LVRPREAKHS RVAPVIALHM QGRAVWTPRD YAPLAEEGYQ RNAIAYRCVR 
MIAEAAASVP WLLYDGAREL SEHPLLRLIE SPNRGQAGAE LFETWYSYLQ VAGNAYLELV 
EVDGAPRELY ALRPDRMKAV PGRAGWPEAY EYSVNGRSVT IPCGERSPVL HMRLFHPSDD 
HYGLSPLEAA AYAIDIHNAA GAWNKALLDN AARPSGALVY KGGEAGANLT EDQFERLKRE 
LAENYQGAAN AGRPLLLEGG LDWQSMGLSP KDMDFIEAKR TAAREIALAF GVPPMLLGIP 
GDNTYSNYRE ANRAFWRGTV LPLVGRSARA LTHWLAPRYE GKLRLWYDAD QVEALAADRD 
ALWARVGAAD FLSDEEKREA VGYGKVKASS T