Gene BBta_3303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_3303
Symbol
ID	5154022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	3458209
End bp	3459276
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	65%
IMG OID	640558166
Product	putative alkanesulfonate ABC transporter, substrate binding protein
Protein accession	YP_001239313
Protein GI	148254728
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGACC GGCGGAGGCT GTTGCAGGCC GGCGCTGCGG CAGCGATTGC GGCGCCGCTT 
GGCGGGTATG GGGCGCAGGC ATTGTCGCTG CGCGCGACAC CGCAGATCGA TCTCTCGCAG 
TTTCCGATCT GCAGGACCGC GACGGATGGA CCAGCCCTCA CGGGGGCGCC GCGCAAGCTG 
AAACTGTCCT GGAATGCCGG TGCGGTCTGC CTGACGCCGG TCCCGGTGGC GATCGATCAG 
GGCTTCTTCA AAAAGCACAA TCTCGACGTC GAGCTGATCA ACTACTCGGG CTCGACCGAC 
CAGTTGCTGG AGGCCATCGC GACCGGCAAG AGCGACGCCG GCCTCGGCAT GGCGCTGCGC 
TGGCTGAAGC CGCTGGAGCA GGGTTTTGAT GTCAAGATCG CCGCCGGCAC GCATGGTGGC 
TGCATGCGCG TGCTGGTGCG CGCCGACTCC GGGATCACCA AGCTCGCAGA CCTTAAGGGC 
AAGGCGGTCG CGGTCGGCGA TCTCGGTGGC CCCGACAAGA ACTTCTTCTC GATCCAGCTG 
GCGCGGCTTG GCATCGATCC GGTGAAGGAC GTCGACTGGC GGGTCTATCC GGGGGCCGTC 
GTCAACGTCG CGGCCGACAA GGGCGAGACG CAGGCGTTCC TGGCCTCCGA TCCGCTCGCT 
TATCTCTGGC TCAAGGACCC CGCCTACAAG GAAGTGGCCT CCAATCTCGA CGGCGAGTAT 
CAGAACCGGG TCTGCTGCAT CCTCGGGCTG CGCGGCAGCC TGGTGCGCGA CGAGCCGGCC 
GTGGGGCGCG CCATCACCCA GGCGCTGCTC GATGCCGCGA TGTTCACGGC ACAGAATCCG 
AGCGAGGCGG CGAAGTCGTT CCAGCCCTAC GCGCCGAAGC AGGCGACGCT GGCCGATCTC 
GAAGGCATGG CGCGCTACCA CACCCATCAT CACCATCCGC ATGGTCCGGC GCTGAAGCAG 
GAGCTGAAGG CCTATGCCGA CGACCTCAAG GTCGTCTCCG TGTTCAAGCC GAGCACCGAC 
ACCAACAAAT TTGCCGAGCG AATCTATGTC GACATTTTCT CTGTCTGA

Protein sequence

MLDRRRLLQA GAAAAIAAPL GGYGAQALSL RATPQIDLSQ FPICRTATDG PALTGAPRKL 
KLSWNAGAVC LTPVPVAIDQ GFFKKHNLDV ELINYSGSTD QLLEAIATGK SDAGLGMALR 
WLKPLEQGFD VKIAAGTHGG CMRVLVRADS GITKLADLKG KAVAVGDLGG PDKNFFSIQL 
ARLGIDPVKD VDWRVYPGAV VNVAADKGET QAFLASDPLA YLWLKDPAYK EVASNLDGEY 
QNRVCCILGL RGSLVRDEPA VGRAITQALL DAAMFTAQNP SEAAKSFQPY APKQATLADL 
EGMARYHTHH HHPHGPALKQ ELKAYADDLK VVSVFKPSTD TNKFAERIYV DIFSV