Gene Bind_3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3462
Symbol
ID	6201062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	3935400
End bp	3937058
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	58%
IMG OID	641707415
Product	extracellular solute-binding protein
Protein accession	YP_001834508
Protein GI	182680362
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0173201
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTAT CAATACAGCA AGCACAAAGC TTCGGGACGC ATGGCCGCAC ATTAGCCAGA 
CGGCTTCTCA TCAAGCTGCT GCTTCTTGCC GGGTTGATCG TCCCCTTTCC TCCGCCGATT 
CAGGCCGAGC CCGCCACGAC CGCGCAAATT TGGCAGCGCG GCGAACTCGG CGATCCGGGC 
TCACTGGATC CCCACAAGGC GACCACGGTC ATCGAGGGCC ATGTCCTCGC CGAGCTTTAC 
GAAGGGCTGG TCATTCTCGA TGCGGAAGGG CGCCTGCAAC CGGGTGTTGC TTCGCACTGG 
TGCGTGAGTG AGGATCGGCG CGTCTATCGC TTTCATTTGC GCCCCGATGC GCAATGGTCG 
AACGGCGACA AAGTGACGGC ACAAGATTTC GTCTATGCCT TTCGCCGCCT TATGGATCCC 
AAGACCGGGG CGCCTTATGC CAATATTCTC TATACGCTGA AAAATGCGGA AAAGGTCAAT 
AAAGGGCAAT TGCCGGTGGA AGCGCTCGGT GTGCAGGCGC CCGCTGACGA TCGTCTCGAA 
ATCACGCTCG ATGAGCCGGT TCCCTATCTG CTCGCGCAAC TCACGCATGT GACGGCGAAA 
CCTCTCCACC GCCGTTCGAT TGAAACCTAT GGCAGCGATT TCGTGCATCC TGGCCATCTT 
GTCACCAATG GCCCCTTCAT GCTGGCGGAA TTCTCGCCCA ACGATCGTCT CGTCCTTGTC 
AAGAACCCGC ATCATTACGA TGCGGCGCGC ATCGGGCTCG ACAAAGAGAT TTTCTATCCG 
CTGGAAGATC GTTCGGCCGC TTTGCGCCGG TTCCTGGCCG GCGAAATCCA GTCCTATAGC 
GATGTGCCCG TCGATCAGAT CCGCTTCGTG CGCCGAACAC TGGGCGACCA ATTCAAGCTC 
GCCCCTAATC TCGGCACTTA CTATTACGCA CTCGACACGC GGCGCCCGCC CTTCGATGAT 
ATTCGCGTGC GCAAGGCTCT CTCGATGGTG ATCGACCGCG ATTTTCTCGC CGAACGAATC 
TGGGGCGGCA CGATGGAGCC GGGCTATAGT TTCGTCCCGC CCGGCATTGA ATCCTACGGC 
ACGCCGGCCG AACTCGCCTT CAAGGATAAA ACGCCCATCG AGCGGGAAGA TGAGGCCAAA 
AAGCTCCTGG CCGAGGCGGG TTTTGGGCCG AGCGGCAAGA CGCTCACCGT CGAGATTCGC 
TATAATATTT CGGAAAACCA CCGCGCCACG GCCGTCGCCG TCGCCGATAT GTGGAAACAG 
ATTGGCGTCG AGACCACGCT TGTCGCCAGT GACGCAACCA GCCATTATGC CTTCATGCAT 
GAGCGCCGGC CCTTCAATGT TCTCCGTTAC GGCTGGTTCG CCGATTTTCC AGATGCGGAA 
AATTTCCTGT TTCTCGCCGA AAGCGGCAAC AAGGGTCTCA ATATTTCGAG CTTCAGCAAC 
GAGACCTATG ATTCATTGAT GCGCGATGCC GCTCAAGAGG ATGATGCAAC GCGGCGCACC 
GCGCTTTTGC ACCAGGCGGA GGCCTTACTG CTCGCCGAGG GTCCCTATGT GCCGCTGCTC 
ATCTTCAAAT CAAAAAATCT GATCTCTCCG AAACTGCGCG GCTGGCACAC CAATGCGCTC 
GATGTGCATC GTGGCCGTTA TATATCGATC GCGCCATGA

Protein sequence

MNVSIQQAQS FGTHGRTLAR RLLIKLLLLA GLIVPFPPPI QAEPATTAQI WQRGELGDPG 
SLDPHKATTV IEGHVLAELY EGLVILDAEG RLQPGVASHW CVSEDRRVYR FHLRPDAQWS 
NGDKVTAQDF VYAFRRLMDP KTGAPYANIL YTLKNAEKVN KGQLPVEALG VQAPADDRLE 
ITLDEPVPYL LAQLTHVTAK PLHRRSIETY GSDFVHPGHL VTNGPFMLAE FSPNDRLVLV 
KNPHHYDAAR IGLDKEIFYP LEDRSAALRR FLAGEIQSYS DVPVDQIRFV RRTLGDQFKL 
APNLGTYYYA LDTRRPPFDD IRVRKALSMV IDRDFLAERI WGGTMEPGYS FVPPGIESYG 
TPAELAFKDK TPIEREDEAK KLLAEAGFGP SGKTLTVEIR YNISENHRAT AVAVADMWKQ 
IGVETTLVAS DATSHYAFMH ERRPFNVLRY GWFADFPDAE NFLFLAESGN KGLNISSFSN 
ETYDSLMRDA AQEDDATRRT ALLHQAEALL LAEGPYVPLL IFKSKNLISP KLRGWHTNAL 
DVHRGRYISI AP