Gene Meso_1949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_1949
Symbol
ID	4182516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	+
Start bp	2089268
End bp	2090788
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	65%
IMG OID	638067845
Product	extracellular solute-binding protein
Protein accession	YP_674507
Protein GI	110634299
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.806443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAAC TGGGGAAACG CCGCATCGTC TGGACGCTTC TGGGGGCGCA GGCCGCACTG 
GCTATGGCCA TGGCGCCGGC CTTCGCCGCC GAGGGCTCGA TAACCCTGGC GCTGCCGTCC 
GAGCCGACGT CGCTCGACGC CTGCGACGAC AGCACCAATG CCAATGCCCG CGTGTTGCGC 
GGCAATATCG TAGAAGGGCT GACGCGGCTC GATCCGCAGA CCGGGGTTGT ACAGCCACTG 
CTGGCGACCG AATGGACCCG CGCCGACGAC AATAACTGGC TGTTTACCAT CCGCCCCGGC 
GTCACCTTTC ACGATGGCGC CCCGCTCGAT GCCGAGGCCG TGGTGTTCGG CATCAACCGT 
TCGATGAATC CCGACCTGGT CTGCCAGACC CTGTCGCTGT TCGCCAACAA GACCACTGCC 
TCGGTCGAAA GCGAAATGGT GGTCCGCATC ACCACCGAGA CGCCCGATCC AATCCTGCCG 
GCGCGCATCG CCTATATCGA CCTGCCCTCG CCGGCCACCC CGGCAAACGC CAAGACCGAC 
ACCCCGATTG GCACCGGCCC CTATCAGCTG GGCTCGCGCG AAATCGGCCA GTCGATTGTG 
CTCAATGCTT ATGCGGGTTA TTGGGGCGAT GCACCGGCCA TCGCCACCGC CACCTATCTC 
TGGCGGTCCG AGCCGACCAT TCGCGCCAGC ATGGTCAAAA CCGGCGAAGC CGATATCGCC 
ATCGACATTC CGTTCCATGA AGCCGAAGGC GCGCCCAACG CCCAGGAATA TTCCACCAAC 
AGCGTGTTCT TCCTGCGTCC GATGCTGCGC AAGCCGCCGC TGGACGACGT GCGGGTTCGC 
CAGGCGGTTG CCGCCGCCAT CGACAAGGTG ACGCTGACGG AAGTGCTGAT GGAGCGTTCG 
GGCAAGCCGA CCGACCAACT GGTGACCCCG CTGATCAACG GCAATGTGCC GGACTTCGCC 
GGCGTGCCCT ATGACGTGGA AAAGGCCAAG GCGCTGCTGG CCGAGGCCAA GGCCGATGGC 
GTGCCGGTGG AGACCCCGAT CGCGCTGATC GCCCGCACCG ACCTGTTCAG CGGCTCGACC 
GAAATCGCCC AGGCGTTGCA GCAGATGCTG CAGCAGGCGG GCTTTACGGT GACGTTGGAA 
GCGGTCGACT CGGTGGCCTG GAGCCCCTGG GCGCGCAAGC CGGATTCGCT GACCCAGCCG 
GTCAACCTGC TGATGTCGGC GCATGACAAT ATTTCGGGCG ACGCATCGCT GTCCTTCCCG 
AACAATTTCG GCAGCGGCGG GCGCCTCAGC ATGGCCGACG ATGCGGACCT GGACGCAAGG 
CTGGCCGCTG CGGCAGTGCT GTCGGGCGAT GCCCGCACCG CGGCCTATCG CGATATTGCC 
CGGGAAGCTT ACGCCGAGCA CATCGTTATT CCGGTCGCCG AGCTGCAAAG CCGGCTGCTG 
CTGTCGGACA GGGTGAACTA TCAGTCCAAC GGCTTCACCG ACATCGAACT GCATCTGTCC 
GAGGTGACTC TCCGTCAGTA G

Protein sequence

MTKLGKRRIV WTLLGAQAAL AMAMAPAFAA EGSITLALPS EPTSLDACDD STNANARVLR 
GNIVEGLTRL DPQTGVVQPL LATEWTRADD NNWLFTIRPG VTFHDGAPLD AEAVVFGINR 
SMNPDLVCQT LSLFANKTTA SVESEMVVRI TTETPDPILP ARIAYIDLPS PATPANAKTD 
TPIGTGPYQL GSREIGQSIV LNAYAGYWGD APAIATATYL WRSEPTIRAS MVKTGEADIA 
IDIPFHEAEG APNAQEYSTN SVFFLRPMLR KPPLDDVRVR QAVAAAIDKV TLTEVLMERS 
GKPTDQLVTP LINGNVPDFA GVPYDVEKAK ALLAEAKADG VPVETPIALI ARTDLFSGST 
EIAQALQQML QQAGFTVTLE AVDSVAWSPW ARKPDSLTQP VNLLMSAHDN ISGDASLSFP 
NNFGSGGRLS MADDADLDAR LAAAAVLSGD ARTAAYRDIA REAYAEHIVI PVAELQSRLL 
LSDRVNYQSN GFTDIELHLS EVTLRQ