Gene BBta_4141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4141
Symbol
ID	5151240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4348266
End bp	4349393
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	66%
IMG OID	640558971
Product	hypothetical protein
Protein accession	YP_001240109
Protein GI	148255524
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0877657
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAAC CTCATCTCAC GATCGCCGAT GAAGTGCAGG CGGCGATTGC CACCGGCTCA 
GCCGAACGCT GCTCAGTGGT GGCCGAGCGG GTCGCGTCCC TGTTCATCGC CTCGGCAGGC 
AACATGGATA TCGAGCAGCA TGCGCTGTTC GCAGACGTTT TCGAGCGCCT CGTCAACACG 
ATCGAGCTGC GTGCGCTCGC CGATGTCAGC GCACGGATCG CGCTCGCCGA GCTCAGCGCG 
CAGCTTGCGC CGGTGCCTCA GGCGCCCGTC GCGGTGATCC GGCGGCTTGC CCGTCATGAA 
GATATTGCCG TTGCCGAGCC GGTGCTCGCG GAGTCACCGC GGTTGAGCAA CGCGGATCTC 
ATCGAGATCG CGAACACCCG CAGCGAACAG CATCTGATCG CGATCGCCGG CCGCTGGTGG 
CTGCAGGAAG TCGTCACCGA TGCCTTGCTG GGGCGGCGTT TTCCCAGCGT GAGCCGCAAG 
CTGATGAAGA ATCCCGGCGC GCGGATCTCC GCGGCTGGCT TTTCCATCAT CCTGTCCCAG 
GCGATCAACG ATCCGGAGCT CACGATCGCC ACCGGCATAC GCGCCGATCT GCCGGCCGGG 
TTGCGCAGGA CGCTGTTGCA GAGCGCGACC GAGGCGGTCA AAGCCCGCCT TCTCGCGTCG 
GCGCCGCCGC ATCTCTATGA GGAAATCCGA AGCGCGATTG CGGCCGCCGC CGCCGGCGCT 
GAGCGGGACA TGGCGCGACA ACGCGATTTC GGCAGCGCCA AAGCGGCGTT CGGGCAGCTG 
CGGCAGACCG GCAGGCTGAA CGAGACCATG CTGCTCGATT TCGCCAGGCA GCGCCGCTAC 
GTGGAGACGA CAGCGGCGAT TGCGGAGCTC GCAAAATGCA GCATCGATCT GGTGCGGCCG 
CTGATGCAGA GCCTGCGCAG CGATGGCATT CTCGTTCCCT GCAAGGCGGC GGGACTGAGC 
TGGGACACGG TGGTGGCCAT TCTCGACAGC CGCTTCGTCT CGGGCGCGAC GCCGCCTGAC 
GAACTCGCCA AGCTCAAGAC CAAATACCGT GCGCTGACCG CCGACGAGGC CCAGCGCACG 
CTCAATTTGT GGAATGTCAG GACAGCGGCC CCGGCCAAGT CGATTTGA

Protein sequence

MSKPHLTIAD EVQAAIATGS AERCSVVAER VASLFIASAG NMDIEQHALF ADVFERLVNT 
IELRALADVS ARIALAELSA QLAPVPQAPV AVIRRLARHE DIAVAEPVLA ESPRLSNADL 
IEIANTRSEQ HLIAIAGRWW LQEVVTDALL GRRFPSVSRK LMKNPGARIS AAGFSIILSQ 
AINDPELTIA TGIRADLPAG LRRTLLQSAT EAVKARLLAS APPHLYEEIR SAIAAAAAGA 
ERDMARQRDF GSAKAAFGQL RQTGRLNETM LLDFARQRRY VETTAAIAEL AKCSIDLVRP 
LMQSLRSDGI LVPCKAAGLS WDTVVAILDS RFVSGATPPD ELAKLKTKYR ALTADEAQRT 
LNLWNVRTAA PAKSI