Gene Plav_0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_0249
Symbol
ID	5453730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	269861
End bp	271873
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	58%
IMG OID	640875812
Product	extracellular solute-binding protein
Protein accession	YP_001411529
Protein GI	154250705
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTGGC CGGCCATGGC CGGATTTGCC ATTCTCATCC TGCTGGCGGC GGCGCTTTTT 
TCCTTTGCCG GAAGTGACGG GGAGCGAAAC GTAGCCGGGG ACGCCACCTC GAGCGACACC 
AGCGAAACGC CCTCCCGGAC GGGTGTGAGT TCAGCCAACG GCCCGGCTTC CGCCGATGCC 
GACAGGCGGC CGAACGAGGT CATAGCCTCC TCATCCACGC CAGAAGGTTT CAATCCGGAA 
ATTCCCAGAC ATGGCTCCTC GCTTTTTGGC GAGTTGAAGT ATGGGCCGGA CTTCAAACAT 
TTCGACTATG TGAACCCTGA AGCGCCGAAG GGCGGGCTCG TTCGCTATGG CGCCTTCGGC 
AGCTTCGACA GCCTGAACGG CTTCATCGTA AAGGGACAGA CGGCCGCCGG ACTCGGCATG 
ATCTACGACA CGCTGATGAC ATCCAGCATG GATGAACCTG CGTCGGAGTA CGGCCTTGTC 
GCGGAGAGTG TCCGCCACCC GGCGGATTAC TCCTCCGTCA CCTATACGCT CCGCCCGCAG 
GCGCGCTGGC ATGATGGCGA GAAGATCACC CCCGAAGACG TGATCTGGAC ATTCGAACAG 
CTGAAGAAAA GCCACCCTTT TTACAACGCT TATTATGCCA ACGTAGTGAA GGTGGAGAAA 
ACCGCCGAGC ACGAGATTAC CTTCTCGTTC AACCAGACCG GAAACCGCGA GCTGCCGCAA 
ATCGTCGGAC AGCTGCCTGT ACTGCCCAAA CATTACTGGA CCGGCAAGAA CGCAAAGGGC 
GAACAGCGGG ATTTCTCCGC GACCACGCTG GAACCGCCGC TCGGCAGCGG TCCCTACAAG 
ATCGAACGCG TATCGCCTGG GCGGTCCATC ACATACCGGC GTGTTGAAGA TTATTGGGCC 
AAGGATCTGC CGGTGAATAT CGGCACCAAT AATTTCGATG CGATGCGCTA CGAATATTAC 
CGCGACGGGA CCGTGGCCCT TGAGGCACTG AAGGGCGATC GTGTGGACTT CCGGGTGGAG 
AACAGCGCGA AGAACTGGGC CACCGAATAC GACATACCGG CGGTTCGTCG CGGCGCCTTG 
AAGATGGAGG AAGTGCGATC GCTCAACCCG CAGGGCATGC AGGCCTTTGC CTTCAATCTC 
CGCCGCGACA AGTTCAAGGA TCCCCGCGTG CGCGAAGCCT TCAATTGGGC TTTCGATTTC 
GAATGGATGA ACAAGAACCT GTTCTATGGA CAGTACACGC GGGCCGACAG TTATTTTTCA 
AACTCGGAGC TTGCAGCACA GGGCCTGCCT GAAGGGCGCG AACTCTCCTT GCTCAGGGAG 
CTGGAAGAGG ACGTAACACC CGATATCTTC AACACGCCAT ATCGCAATCC CGTCACTGAC 
GGCGGCGGCA ACAACCGGGG CAACTTGCGC AAGGCTGCCG CACTTTTGGC GGAAGCAGGC 
TGGACGGTGA AAGACGGCAA ACTCGTCGAT GAAACGGGAC AGCCGATGAC CGTCGAGTTT 
CTGCTCGACC AGCCGACCTT TGAGCGCGTC GTCGCCCCCT TCAGGCAATC GCTCGACAAG 
CTTGGTATCC AGTCGACGAT GCGCACCGTC GATACCCCGC AGTATCAGAA CCGTACTGAC 
AATCGCGATT TCGACATCAT CGTCGAAACC TTTGGCCAAT CGCTCTCGCC GGGCAATGAG 
CAAAGAGAAT TCTGGGGTTG TGAGGCGGCG GATGCGCCGG GCAGCCGCAA TGTCATAGGC 
ATATGCGACC CGGCGGTTGA AAAGCTGATA GAAAAAATAA TCTACGCAAA AAGCCGTGAC 
GCACTTGTTG CCGCTTCGCG CGCTCTCGAC CGTGTTCTCC TTGCCGGGCA TTATGTGATC 
CCGCAATGGT ATTCGCCGAA TATGCGCGTC GCTTACTGGT CCCGCCTGAA GCATCCGGAG 
AAAATGCCGC CATACTCCAT TGGCTTTCCG ACAATCTGGT GGATGGACCA ATCCGCACCC 
GCACCGCAAC CGGCGGCGGA AGAAGCGCGA TGA

Protein sequence

MTWPAMAGFA ILILLAAALF SFAGSDGERN VAGDATSSDT SETPSRTGVS SANGPASADA 
DRRPNEVIAS SSTPEGFNPE IPRHGSSLFG ELKYGPDFKH FDYVNPEAPK GGLVRYGAFG 
SFDSLNGFIV KGQTAAGLGM IYDTLMTSSM DEPASEYGLV AESVRHPADY SSVTYTLRPQ 
ARWHDGEKIT PEDVIWTFEQ LKKSHPFYNA YYANVVKVEK TAEHEITFSF NQTGNRELPQ 
IVGQLPVLPK HYWTGKNAKG EQRDFSATTL EPPLGSGPYK IERVSPGRSI TYRRVEDYWA 
KDLPVNIGTN NFDAMRYEYY RDGTVALEAL KGDRVDFRVE NSAKNWATEY DIPAVRRGAL 
KMEEVRSLNP QGMQAFAFNL RRDKFKDPRV REAFNWAFDF EWMNKNLFYG QYTRADSYFS 
NSELAAQGLP EGRELSLLRE LEEDVTPDIF NTPYRNPVTD GGGNNRGNLR KAAALLAEAG 
WTVKDGKLVD ETGQPMTVEF LLDQPTFERV VAPFRQSLDK LGIQSTMRTV DTPQYQNRTD 
NRDFDIIVET FGQSLSPGNE QREFWGCEAA DAPGSRNVIG ICDPAVEKLI EKIIYAKSRD 
ALVAASRALD RVLLAGHYVI PQWYSPNMRV AYWSRLKHPE KMPPYSIGFP TIWWMDQSAP 
APQPAAEEAR