Gene BBta_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_2149
Symbol
ID	5155300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	2227912
End bp	2229036
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	63%
IMG OID	640557085
Product	hypothetical protein
Protein accession	YP_001238241
Protein GI	148253656
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.393338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGTT GGAAACAGAG CAACGCGGCT GCAGCGAAGC CGCCCAGCCC GGAGCCGTCG 
CCGGCGCTTG CGCCGGTTGC GCCCTCACAG CAGGACGAGT TGATGCGCCG GTGGATCGCG 
TTCGCCGGCA TGCAGCAGCG CGTGATCCGG ACGCTTGTCA GCGAGATCCA GCAGACCTCC 
GCCGTGGTGG AGACCGAGGC GGACAGTCTG AGCAGCCGGT TTCAGCGTCT CGCCGTCTGC 
GCGGGGCAGC AGACGGAACG CGTCGAAAGC CTGAGCAAGC TCGCGATGGG CATCGAGGTC 
GATGGCGAGG CGATCGCGAT CGATCGCATC GCGGGTCTGC TCGAGGAGAC ATTGAGCGAC 
GTCGTCGAGA AGATCCTGCT GCTGTCGAAG GACGCGATGT CGATGGTCTA CGCGTTGAGC 
GAGCTCAACG GGAACGTCAA CCGCGTCGAC TCCTGCATGG AAGAGTTGAA CAAGATCAAC 
CGCGTCACCA ATATGCTGGC GCTCAATGCC AGGATCGAGG CGGAGCGGGC TGGAACGGCG 
GGCGCAGCGT TTCGTGTGGT CGCCGGTGAG GTCCGCGAGC TGTCGAGCGC CACGCAGCGG 
TTGTCCGTCG ACATGGCGAC GGAGCTGCAT GCCGTCACCC AGGGCATCGA GAACGGCCAC 
GAAACGCTGC AGCGCGTCGC GACCATCGAT ATGTCGCAGA ACCTGATGGC CAAGGACCGT 
CTCGAGCTGC TGATGAACGC CCTGATCGAG CGCGGCGGCA ACCTGACCGA AGTCGTCAAT 
GAAGCGATGA AAGAAGCCGA GGTGATCTCG GCCGACGTCG CCGGCATGAT CACGGGCATC 
CAGTTCCAGG ATCGCACGCG GCAACGGCTC GAACATGTGG TCGACACGTT GCGCGTTGTC 
GACGAGGCGC TCGACGAGCT GAAGACGACG ACGGCCGATG TCCTGGATGA ACCGGTCGTG 
GAGACGACAA TCGACAATGA ATGGGTCAAG ACGCTGCTCG ATCGGTTCAC GCTCGGCGAA 
TTGAGGTCGC GCTTCGTCGC GCAGATTCTC GAAGGCAAGC AGCCGGCCGA TCCGAGCGAA 
ACGGAGGCCA GCCCTTCGCA GACGGGGACC ATTGAACTGT TTTAG

Protein sequence

MFGWKQSNAA AAKPPSPEPS PALAPVAPSQ QDELMRRWIA FAGMQQRVIR TLVSEIQQTS 
AVVETEADSL SSRFQRLAVC AGQQTERVES LSKLAMGIEV DGEAIAIDRI AGLLEETLSD 
VVEKILLLSK DAMSMVYALS ELNGNVNRVD SCMEELNKIN RVTNMLALNA RIEAERAGTA 
GAAFRVVAGE VRELSSATQR LSVDMATELH AVTQGIENGH ETLQRVATID MSQNLMAKDR 
LELLMNALIE RGGNLTEVVN EAMKEAEVIS ADVAGMITGI QFQDRTRQRL EHVVDTLRVV 
DEALDELKTT TADVLDEPVV ETTIDNEWVK TLLDRFTLGE LRSRFVAQIL EGKQPADPSE 
TEASPSQTGT IELF