Gene Meso_4084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_4084
Symbol
ID	4182784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	-
Start bp	4394796
End bp	4396664
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	59%
IMG OID	638069980
Product	extracellular solute-binding protein
Protein accession	YP_676616
Protein GI	110636408
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGCTA AGGTCATCGA ACAGGGGAAA AAGCTAACCC TTGTCGGTCT TGGGATGTTC 
TTACTGGTCG CGAACGCAAG CGCGCAGGAG TGGCGCACCA CAAGTTCGCT GGTCAATCCT 
GAGGCGGAGA CCAAGCCCTT TGAACGCTAC AGCTATGTAA ATCCAGAAGC ACCGAAGGGC 
GGCACTCTGA ACTCCGCCGT CTTCGGCACA TTCGACAGCT TCAATCCCTT CATTGTGCGC 
GGCACGCCGG CGGCGGGCCT CACCTATTTC GGCGGCATGT TGTGGGAAAC GCTCATGCAA 
CAGTCGCCCG AAGATCCGGG CACCAGCCAT CCGTTGATCG CCGAGGCGTT CAAATACCCG 
GAGGATTATT CCTCGGCCAC CTACCGTCTC AATCCGAACG CCCGCTGGCA TGACGGCAAA 
CCTGTCACCG TGGAGGACGT GATCTGGTCG TTCAACATGC TCAAGGAGAT CAGTCCGCAG 
CACAACCGCT ATTTCGCGAA TGTCGAGGAG GCCGTCGCGC TCTCCGACAC AGAGGTCGAA 
TTCCGCTTCG ACCAGGGCGG AAACCGCGAG CTGCCGCATA TCATGGGCGA CCTTCCGGTC 
CTTCCCAAGC ACTGGTGGGA GGGGACGGAT TCCCAAGGCA GGCAGCGTAA TCTCAGAAAT 
CCCACCCTGG AGCCGCCGCT CGGCAGCGGA CCCTACAAAA TCGCGAGCTT CCGCCCCGGC 
TCGGAAATCA TATGGGAGCG CGCCGAAGAT TATTGGGCTG CGAATCTGCC GGTCAATATC 
GGCCGGTACA ATTTCGATCG CATCCGATAC ACGTATTTCC AGGACGACAA TGCCGAGTTC 
CTGGCGTTCC AGAAAGGCGG CATCGAGGAT GTACGGCGCG AGCTGAGCAC GCGGCGCTGG 
TCACAGGAAT ATGACTTTCC CGCGGTGCAG GATGGCGACG TCATCAAGCG TGAATTTACC 
AGCACGGCCA TCGAGGGGAT GCAGGCCTTC GTCTTCAATA TGCGGAGACC TCGGTTCCAG 
GACAGCCGCG TGCGCGAGGC TCTTACGCTG GCATACAATT TCGAGGAACA GAACAGAACG 
CAGTTCTTCG GGCTCAACAA GCGCTTCAGC AGCTATTTCG AGCGCTCGGA GCTGGCATCG 
AGCGGTCTGC CCCAAGGGCA GGAGCTGGAA ATCCTGGAGG AATTCCGCGA TCAACTTCCG 
CCGGAAGTTT TTACCGAAGA GTTCAAGCTG CCCGTCTATG ATTCGCCGCA GTCCGAACGG 
CAATATCTGC GCGAGGCGGT TCGCCTCTTC AACGAGGCCG GGTGGGAAAT CCAAAGCGGC 
CGGATGATCA GCAAAGAGAC AGGCGAGCAA TTCCGCATCG AGTTTCTTGG AGCATCGCCG 
ACCGCCGAGG TCATCACCGG CGGCTTCATG GCCAATCTAC GGAAGATCGG AATCAATGCG 
ACGCTGCGCA TCGTCGACAC GTCGCAATAT ATACAGCGTG TTCAGAACTT CGAATTCGAT 
GCCATCACAG CCCGCTTCCC CCAGTCCAAC TCTCCGGGCA ACGAGCAGCG GGATTACTGG 
AGTTCGGAGG CCGCCGACAT CCCGGGTTCG CAAAACGTGA TCGGCATCAA GGATCCGGTG 
GTGGACGCCT TGGTGAACAA GATCATCTAC GCCAAGAACC GCGAGGAACT CGTCGCGACG 
GTTAGGGCGC TCGATCGCGT GCTCCTCTGG AAGTACTACG CGATCCCGCA ATACTACCAG 
CCCACCCTTC GCTATGCCTA CTGGAACAAA TTCGGCATAC CGGAAAAGCA GCCGGGCTAT 
GCGGGCGTGG ATGTCGATTC CTGGTGGGTC GATCCCGAGC TCGAGGCGGC GCTCGAGGCG 
AAGTACTAG

Protein sequence

MLAKVIEQGK KLTLVGLGMF LLVANASAQE WRTTSSLVNP EAETKPFERY SYVNPEAPKG 
GTLNSAVFGT FDSFNPFIVR GTPAAGLTYF GGMLWETLMQ QSPEDPGTSH PLIAEAFKYP 
EDYSSATYRL NPNARWHDGK PVTVEDVIWS FNMLKEISPQ HNRYFANVEE AVALSDTEVE 
FRFDQGGNRE LPHIMGDLPV LPKHWWEGTD SQGRQRNLRN PTLEPPLGSG PYKIASFRPG 
SEIIWERAED YWAANLPVNI GRYNFDRIRY TYFQDDNAEF LAFQKGGIED VRRELSTRRW 
SQEYDFPAVQ DGDVIKREFT STAIEGMQAF VFNMRRPRFQ DSRVREALTL AYNFEEQNRT 
QFFGLNKRFS SYFERSELAS SGLPQGQELE ILEEFRDQLP PEVFTEEFKL PVYDSPQSER 
QYLREAVRLF NEAGWEIQSG RMISKETGEQ FRIEFLGASP TAEVITGGFM ANLRKIGINA 
TLRIVDTSQY IQRVQNFEFD AITARFPQSN SPGNEQRDYW SSEAADIPGS QNVIGIKDPV 
VDALVNKIIY AKNREELVAT VRALDRVLLW KYYAIPQYYQ PTLRYAYWNK FGIPEKQPGY 
AGVDVDSWWV DPELEAALEA KY