Gene BBta_3845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_3845
Symbol
ID	5150014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4030566
End bp	4031978
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	66%
IMG OID	640558683
Product	putative aldehyde dehydrogenase family protein
Protein accession	YP_001239827
Protein GI	148255242
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACT ATCATCTTCT GATCGGCGGG GCGTTGGTGC CGGGCGAGAC GACCATGCCG 
GTCATCAATC CCGCGACCGA GGAGGTGCTG ACCGATTGTC CGCGAGCATC CAAGGACCAG 
CTCGACGCGG CGGTGGCCGC CGCCAAGGCC GCCTTTCCGG CCTGGGCCGC CACCCCGATC 
ACGGAACGCC GCCGCCTGAT CGGCAAGATG GCGGACATCA TCGAGGCCCA TGCCAACGAC 
CTCGCCCGGA TCTTGACCAG CGAACAAGGC AAGCCGCTCG CCGACGCCAC CGGCGAGGTG 
CTCGGCATGG CCGGCTTCTT CCGCTATCTG GCGTCACTGG ATCTGCCGAT GCGGGTGCTG 
GAGCGTTCGG GCGACCGGCA GGTCGAAGCC TATCGGCGCC CCCTGGGCGT GGTCGGCGCC 
ATCATCCCCT GGAACTTCCC GCTGCTGATC CTCGGCTTCA AGCTGCCACC TGCCCTGCTC 
GCCGGCAACA CGCTGGTGGT CAAGCCGGCG CCGACGACGC CGCTATCGAC GCTGCGCTTC 
GCCGAGCTGG TCAAGGATGT GCTCCCCGCC GGCGTGCTCA ACGTGATCGC TGACGCCAAC 
GATCTCGGCG ATCCCATGAC GAAGCATCCG GACATCCGAA AGATCTCGTT CACGGGCTCG 
ACCGCCACCG GCCAGAAGGT GATGGCGAGC GCCGCCCAGA CCTTGAAGCG CATCACGCTC 
GAGCTGGGCG GCAACGACGC CGGCATCGTG CTCGACGACG TCGATCCGAA GACGGTCGCG 
CCCGGCATCT TCGACGGCGC CTTCCAGAAC TCAGGCCAGG TGTGCCTCGC GATCAAGCGG 
CTCTATGTCC ATGAAAGCGT CTATGACGAG ATTTGCGACG AGCTGGTCGC GATCGCCAAG 
AGCACGGTCG TCGATGACGG CTCCAAGCAG GGCACCAAGC TCGGACCGCT GCAGAACAAG 
ATGCAGTACG AGAAGGTGAA GGCGTTTCTC GACGACGCGC ACAAGAACGG CAAGGTGATC 
GCCGGCGGCG CGGCGATGGA CCGCCCCGGC TATTTCATCG CGCCGACCAT CGTGCGCGAC 
ATCGCGGAAG GCTCCAAGCT GGTCGACGAG GAGCAGTTCG GACCGGTGCT GCCCGTGATC 
AAATACTCCG ATTCCGACGA CGTGATCCGC CGCGCCAATG CTTCCAGCTA CGGGCTCGGC 
GCCTCGGTGT GGTCGTCAGA TCCGAAACGC GCCCACGAGA TCGCCACGCG GATCGAGGCC 
GGCACGGTAT GGATCAACAA GCATCTCGAC ATGGCGCCGC ACATCCCGTT CGGCGGCGCC 
AAGCAATCCG GCATCGGCAC CGAATTCGCC GAGGAAGGCC TCGCCGAATT CACCCAGCTG 
CAGATCATCA ACGGACCCGG CGTCGCCGCC TGA

Protein sequence

MSDYHLLIGG ALVPGETTMP VINPATEEVL TDCPRASKDQ LDAAVAAAKA AFPAWAATPI 
TERRRLIGKM ADIIEAHAND LARILTSEQG KPLADATGEV LGMAGFFRYL ASLDLPMRVL 
ERSGDRQVEA YRRPLGVVGA IIPWNFPLLI LGFKLPPALL AGNTLVVKPA PTTPLSTLRF 
AELVKDVLPA GVLNVIADAN DLGDPMTKHP DIRKISFTGS TATGQKVMAS AAQTLKRITL 
ELGGNDAGIV LDDVDPKTVA PGIFDGAFQN SGQVCLAIKR LYVHESVYDE ICDELVAIAK 
STVVDDGSKQ GTKLGPLQNK MQYEKVKAFL DDAHKNGKVI AGGAAMDRPG YFIAPTIVRD 
IAEGSKLVDE EQFGPVLPVI KYSDSDDVIR RANASSYGLG ASVWSSDPKR AHEIATRIEA 
GTVWINKHLD MAPHIPFGGA KQSGIGTEFA EEGLAEFTQL QIINGPGVAA