Gene BBta_5253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5253
Symbol
ID	5154631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5476598
End bp	5478211
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	63%
IMG OID	640560022
Product	putative ABC transporter (substrate-binding protein)
Protein accession	YP_001241146
Protein GI	148256561
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0401744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCTC ATCCGCGCCG GGCTCATTCC GTGCTCGCAT CCTGGCTTGT TGCGTCCGCT 
GTTTTGCTAT CGCCCTGTCT TGCGCCGCAG GCGCTCGCCG CTGGCAAGAC AACCATCGCC 
GCCGTGATGC ATTCCGACCT GCGGGTGATC GATCCCGGCT TCACCACCGC CTATATCACC 
CGCGATCATG GCTACATGGT CTATGACACG CTGCTCGCCA CCGATGCTAA CTTCAAGATC 
CAGCCGCAGA TGGCGGATTG GAAGGTCTCG GACGACAAGC TGACCTACAC CTTCACCTTG 
CGCGATGGCT TGAAATGGCA TGACGGCACG CCGGTCACGG CGGAGGATTG CGTCGCCTCG 
CTGAAGCGCT GGGGCCGCAA TGACGGCATG GGCCAGAAGC TGATGGACTT CACCGCGAGC 
CTGGAAGCTC CGGACGCCAA GACCATCGTG CTGAAGCTGA AGGAGCCTTA TGGCCTGGTG 
CTGGAGTCGA TCGGCAAGCC GTCGTCGCTG GTGCCGTTCA TGATGCCGAA GCGCCTCGCT 
GAGACGCCGC AGGGCCAGCA GATCCCGGAG CAGATCGGCT CCGGCCCGTT CAAATTCGTC 
AAGGCGGAAT TTCAGCCGGG CGTGAAGGCG GTCTACGAGA AGAACACCGA CTATGTGCCG 
CGCAAGGAGC CGGCGAGCTG GACCTCCGGC GGCAAGGTGG TGAAGGTCGA TCGCGTCGAA 
TGGATCACCA TGGCCGATGC GCAGACCGCG GTGAATGCGC TGCAATCGGG CGACATCGAT 
TTCATGGAAG CGCCGCCCTA TGATCTGTTG CCGGTGCTGG AAGCGAACCC GGATCTGAAG 
ATCGATGTTC TCAACAAGTT CGGCTTTCAG ACGCTGGGCC GGATGAACTT CCTCAATCCG 
CCGTTCGACA ATGTGAAGGT GCGCCGCGCG GCGTTCCTGG CGCTGAACCA GAAGGACGTG 
CTCGACGCGC TTGTCGGCAA TGCCAAATAT CAGAAGATCT GCGGCGCGGT GTTCGTCTGC 
GGCACGCCGC TGGAGACCGA TGTCGGTGCG GAAACGTTGA TCAAGGGCAA CGGCATGGCC 
GAGGCCAAGA AGGCACTGGC GGAATCCGGC TATGACGGCA CGCCGATCGC GATCATGGCG 
CCCGGCGATG TCGGTGCACT GAAGCCGCAG CCGATCGTGG CCGCGCAGCT GCTGCGTGAG 
GCCGGCTTCA AGGTCGACCT GCAGGCGACG GACTGGCAGA CCGTGGTGAC GCGCCGCGCC 
AGCCAGAAGC CGGTCAAGGA CGGCGGCTGG AACATGTTCT TCACCAACTG GGTCGGTGCC 
GACGTCGCCA ATCCCGTCGT CAACGTCTCT GTCGGCGGCC GGGGCACCAA GGGCGGCTGG 
TTCGGCTGGG CCGAGGATGC CGAGATCGAG AAGCTGCGCG ACGCCTATGC GCGCGCGTCT 
TCGCCGGACG AGCAGAAGAA GATCGCCGCC GAGATCCAGA AGCTGAACTA TGAGCGCGTG 
ATCTACATCC CGCTCGGCCA GTACCTCCAG CCGAGTGTCT GGCGCAAATC CTTGACCGGC 
GTGCTGGACG GTCCGGCGAC GCCGGTGTTC TGGAACATCG ACAAGAAGGA GTAG

Protein sequence

MSPHPRRAHS VLASWLVASA VLLSPCLAPQ ALAAGKTTIA AVMHSDLRVI DPGFTTAYIT 
RDHGYMVYDT LLATDANFKI QPQMADWKVS DDKLTYTFTL RDGLKWHDGT PVTAEDCVAS 
LKRWGRNDGM GQKLMDFTAS LEAPDAKTIV LKLKEPYGLV LESIGKPSSL VPFMMPKRLA 
ETPQGQQIPE QIGSGPFKFV KAEFQPGVKA VYEKNTDYVP RKEPASWTSG GKVVKVDRVE 
WITMADAQTA VNALQSGDID FMEAPPYDLL PVLEANPDLK IDVLNKFGFQ TLGRMNFLNP 
PFDNVKVRRA AFLALNQKDV LDALVGNAKY QKICGAVFVC GTPLETDVGA ETLIKGNGMA 
EAKKALAESG YDGTPIAIMA PGDVGALKPQ PIVAAQLLRE AGFKVDLQAT DWQTVVTRRA 
SQKPVKDGGW NMFFTNWVGA DVANPVVNVS VGGRGTKGGW FGWAEDAEIE KLRDAYARAS 
SPDEQKKIAA EIQKLNYERV IYIPLGQYLQ PSVWRKSLTG VLDGPATPVF WNIDKKE