Gene Plav_0239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_0239
Symbol
ID	5455084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	258408
End bp	259388
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	640875802
Product	TPR repeat-containing protein
Protein accession	YP_001411519
Protein GI	154250695
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGTT TTGCAGACCA AACCCCGCAA TTCACCTTCC GCGCAAAGCG CGGCGGCTGG 
CTTGCCGCGG CATCGCTCTG CTCCGCCCTC GCGCTTTCAG GATGTGCATC AACCAGCACC 
ACCTCGACCG CCCAGACGCC CAGCGAAGCC GCGCAGGCTC AGATCGACAC ACCGGCGCTC 
CGGAATGCAG CCATCGAAAG CACAAAGACT CAGGATTATG TCGCCGCCGC CGCGTACTGG 
GGCGCGCTTT ACGAGCGCTC GCCCGACGAT GCTGTTACGA CCGTCAACTA TTCCAAGGCG 
CTCCGGCAGA TAGGTTCGAT TGCACAGTCG CTCACCGTGA TGCAGCGCGC TCAGATAAAA 
CATCCCGAGA ACGCGGATGT GCTCGCCGAA GCCGGCAAGG CTCTGGCCGC GAGCGGCAGG 
CCGGACCAGG CGGTTGCGAT GCTGGAAACC GCCGCCCGCA AATCGCCGCA AGACTGGAGT 
ATTCGCTCGG CCCTCGGCGT AGCGCTCGAT CAGACGGGCC GATACGAGGA AGCCAAGAGC 
CGCTACAACG AAGCGCTCGA ACTTTCGCCC GACAACCCGT CCGTACTTAC CAACCTCGGC 
CTTTCCTATG CGCTGACGGG AGATCTCGAC ATGGCCGAGC GGACACTCCG CAAGGCCGTC 
GCAGATACCC GCGCCGACGC TTACGCGCGG CAAAATCTCG CCATCATTCT CGGCCTCAAG 
GGAAACTTCG ATGAGGCTGA ACGGCTGGCA CGCGCCGACC TGCCTGCCAA CGTTGCAGAC 
GGCAACATCG CCTATCTCCG TTCCATGCTT GCGCAACCGG CATTGTGGAA ACAGCTCGAA 
GAGCTTGACC GGCAGCCTGA CACGACAGCA CCCGCACCTC AGCCAACCGG CAAACAACCT 
GCCGCTGCGA AAGAAAGCCG TAACGAGAAG GAAGACCAGG TATCGTCGCT GCCGCCGGAG 
ACCCGCGTTT CAATTTACTA G

Protein sequence

MSCFADQTPQ FTFRAKRGGW LAAASLCSAL ALSGCASTST TSTAQTPSEA AQAQIDTPAL 
RNAAIESTKT QDYVAAAAYW GALYERSPDD AVTTVNYSKA LRQIGSIAQS LTVMQRAQIK 
HPENADVLAE AGKALAASGR PDQAVAMLET AARKSPQDWS IRSALGVALD QTGRYEEAKS 
RYNEALELSP DNPSVLTNLG LSYALTGDLD MAERTLRKAV ADTRADAYAR QNLAIILGLK 
GNFDEAERLA RADLPANVAD GNIAYLRSML AQPALWKQLE ELDRQPDTTA PAPQPTGKQP 
AAAKESRNEK EDQVSSLPPE TRVSIY