Gene BBta_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4043
Symbol
ID	5152501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4241958
End bp	4243115
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	640558876
Product	hypothetical protein
Protein accession	YP_001240015
Protein GI	148255430
COG category	[S] Function unknown
COG ID	[COG4645] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0814624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA ATGCGACGCT GCCCGAGAGA GGGCGCGACC TGCGGCTCGA CCTGTTCCGC 
GGCATCGCCA ATTGGGCGAT ATTTCTCGAT CATATCCCCG ACAATGTGGT GAACTGGATC 
ACGACCCGGA ATTACGGCTT CAGCGACGCC GCTGACCTGT TCGTGTTCAT CTCCGGCTAT 
ACCGCGTCCT TCGTCTATGC CCGCATGATG ATCGACCGCG GCTTCATCGT CGGCGCCACC 
CGCCTGTTCA AGCGGGTGTG GCAGCTCTAC GTCGCTCACA TCGTGCTGTT CGTCATATAT 
ATTGTGGCCA TCAGCTATCT GGCGACACGC TTCGGCGTCT CCGAGATCAT CGACGAGTTC 
AACGTTGCCG GACTGGTCGA CCATGCCAGC GATACGCTGG CGCAGGGGCT CATCCTGAAG 
TTCAAGCCGG TCAATCTCGA CGTGTTGCCG CTCTATATCG TGCTGATGGG TTTCTTTCCG 
CCGGTGCTGT GGCTCATGCT GCGGCAGCCG GATATCACGA TGATCGCCTC GATCGTGCTT 
TGGCTCCTCG CGCGCCAGAT GGGGTGGAAT TTCGCCGCCT ATCCGGCCGG CACTTGGTAT 
TTCAATCCGT ATTGCTGGCA GGTGCTGTTC GTGTTCGGCT CGTGGTGCGC GCTCGGCGGC 
GCGCGCCGCT CGATGGGCAT CATCATGGCC CCGGCGACAC TCTATTTCTG TCTGGGCTAC 
CTGCTGCTCG CATTGATCAT GACCATGGCC GGCCGCTTTC CGGACTATGG CACGATGTTG 
CCGCACTGGC TCTATTCGGC GTTCAATCCG AACGACAAGA CCAATCTCGC GCCCTACCGT 
TTCCTGCATT TCGTGGTGAT CGTCATCCTG GTGATCCGCT TCGTGCCGAA GGAATGGCCG 
GGCCTGGAAT GGAAGGGCTT CGATCCGCTG GTGGTGTGCG GTCAGCAATC GCTCGCGGTA 
TTCTGCGTCG GCGTCTTCCT GTCCTTCATC GGCCATTTCA CGCTGATGCT GAGCTCGGGC 
TCGCTGCTGG CGCAGATCCT GGTGAGCGCC GCAGGGATCG CGATCATGAC GACGGTGGCC 
TATTACATCT CGTGGTCGAA GCGCCAGGAC AAGCCGCTGC CGAAGCCAGC CACACCCAAG 
ACCGCCGCGG CGAAGTGA

Protein sequence

MKINATLPER GRDLRLDLFR GIANWAIFLD HIPDNVVNWI TTRNYGFSDA ADLFVFISGY 
TASFVYARMM IDRGFIVGAT RLFKRVWQLY VAHIVLFVIY IVAISYLATR FGVSEIIDEF 
NVAGLVDHAS DTLAQGLILK FKPVNLDVLP LYIVLMGFFP PVLWLMLRQP DITMIASIVL 
WLLARQMGWN FAAYPAGTWY FNPYCWQVLF VFGSWCALGG ARRSMGIIMA PATLYFCLGY 
LLLALIMTMA GRFPDYGTML PHWLYSAFNP NDKTNLAPYR FLHFVVIVIL VIRFVPKEWP 
GLEWKGFDPL VVCGQQSLAV FCVGVFLSFI GHFTLMLSSG SLLAQILVSA AGIAIMTTVA 
YYISWSKRQD KPLPKPATPK TAAAK