Gene BBta_5079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5079
Symbol
ID	5151369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5297906
End bp	5299969
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	64%
IMG OID	640559856
Product	hypothetical protein
Protein accession	YP_001240985
Protein GI	148256400
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0326804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGACC TTGCGATTGT TGGTGGCGGT CCGGGCGGCC TGATGAGCGC CTGGTACTTG 
AGACGGAAGC TTGGCGATCT CTGCAAGGTC ACGATTTTCG AAGCCTCCGA CCGGCTCGGC 
GGCAAGATCG TGACGCGAAA ATTCGATACG GCGCCGGCGA TGTATGAAGC GGGTGTCGCT 
GAGATCTACG ACTACTCGAT GACCGGGCCC GATCCGCTGC GCGAGCTGAT CCAGCATTTC 
GGCCTGCAGA CGATTCCGAT GGACGCGCTT CAGGTGCAGC TCGACGGCGA GCTGCTCGAC 
GACGTGCCGG GCCTGCGCCG CAAATACGGG CCGAAGACGG CAGCCGCCGT CGAGGCGTTC 
CGCAAGCGCT GCTCCGAGGT GATGTCGCCG GTCGAGTATT ACGAGGGCGT CGGCGCGCAC 
GACAACGAGC ACCCCTGGGC CTACAAGACC TGCGAGGAGC TGCTCGACGA GGAGGTCGAG 
GATCCCACCG CCAAGCGCTT CTTCAAGGTG ATGTCGCGCT CCGACATCGC AACCGAGGCC 
CACAACACCA ACGGCCTCAA CGCGCTCAAG AACTTCGTGA TGGATATCGA CGACTATATC 
GGTCTGTATT CCATCCAGAA CGGCAATGAG CAGCTGATCG AGTGCCTGCG CTCGGAGGTC 
GACGCCGACA TCCAGCTCAA TCATCGTGTG CTGCGCATCG GCAAGACCGA GCAGGGCCGC 
TACCGGCTCA ACATGATGAA CGGCAAGGGC CCGGAGACCC GCGAGTTCGA TCTCGTGCTG 
GTGTGCCTGC CGCATTCCTG GCTGTCGACG GTCGGCTGGG AGGGCGAGAA GCTGCGCCGG 
TCGATGGTCA AGCACATCGC CTATTTCGAC CGTCCCGCGC ATTACCTGCG CGTCTCGATC 
CTGTTCGATT CGCCGTTCTG GGGCGACAAG ATCCCGGGCT CCTGGTTCAT GTCCGAGGCG 
TTCGGCGGCT GCTGCATCTA CAATGAAGGC TCGCGCCACG ACGTCGGCAA GCACGGCGTG 
CTGAACTGGC TGATCGCCGG CTCCGATGCG CTGGCCTTCG CCAATCTGTC CGATCAGGAG 
CTGATCGACG CCGCGCTGAA ATCGCTGCCG GCGGCGCTCG GCGATGCGCG GGCGCATTTC 
ATGGAAGGCA AGATCCATCG CTGGCTGTCG TCGGTGAACG CGTTGCCGGG CGGCCTGCCG 
GTGCGCGACG TCATGACGAA TCACCGGCCA GAGCCGAAGG AGCATCCCGG CATCGTCGTG 
GTCGGCGACT ATCTGTTCGA TTCGACGCTC AATGGCCTGC TCGATTCGTC GGATGCCGCC 
ACCGACATCA TCCTGACCGA GATGATGCGG CTGCGCCGCG CCCGCGCGCA GGCGGAGAAG 
CCGCTGTCGG ACAAGATCGA CCGCGACTAT TTCGACAATT ACCGCGGGCA GGGGCCGTAC 
AGTGAAGCCT GGTCGCAGTT CACCGATCCG GACTATCTGA CCAGCCTGAT CAAGATCGTC 
TGGAACAAGG GCAAGGGCAA AGGCTACAAG CTTCTCGTCG CAGGCTCTGC CAGTGGCGAG 
CTGGTCGGTG CGCTGCGCGA CCGCGGCATC GATGCCTGGG GCATCGAGAA CAACCGCTAT 
ATCCACGGCA AGACGCCGAA GGCGCTGAAG AAGTACAACA AGCTCGGCAC GATCACCGAC 
CTGCCGTTCA AGGCAGGTGA GTTCGATTTC GTGTTCGAGA CCAGCCTCTG TCATCTCGGC 
GACAAGCAGG TGGCGCGGGC GATCCGCGAA CTGAACCGCG TGGTCAAGAC CGGCCTGGTC 
TTCGGGTCGA TCACCTCGGA CATGGCGCCG GCGCTGGTCG ACCGCTACGA CCTGCTGCGC 
GGCGTCAAGA AGCTCGGCAC CTGGTGGGAA TGGTCCGAGC TTTTCTTCGG CAATGGCTTC 
GACCTCGCGA TGCACCGCCG CGACTGCACC GACGAGGTGT GGGCCGCGAC GCTCGCTGCC 
AACAAGGGCC CGGGCCAGTG GTACGCGGAC GCTGACAGCC TGCGCTACTC CTTCTTCGAC 
AAGGTCGAGG ACGACGAGGA CTAG

Protein sequence

MLDLAIVGGG PGGLMSAWYL RRKLGDLCKV TIFEASDRLG GKIVTRKFDT APAMYEAGVA 
EIYDYSMTGP DPLRELIQHF GLQTIPMDAL QVQLDGELLD DVPGLRRKYG PKTAAAVEAF 
RKRCSEVMSP VEYYEGVGAH DNEHPWAYKT CEELLDEEVE DPTAKRFFKV MSRSDIATEA 
HNTNGLNALK NFVMDIDDYI GLYSIQNGNE QLIECLRSEV DADIQLNHRV LRIGKTEQGR 
YRLNMMNGKG PETREFDLVL VCLPHSWLST VGWEGEKLRR SMVKHIAYFD RPAHYLRVSI 
LFDSPFWGDK IPGSWFMSEA FGGCCIYNEG SRHDVGKHGV LNWLIAGSDA LAFANLSDQE 
LIDAALKSLP AALGDARAHF MEGKIHRWLS SVNALPGGLP VRDVMTNHRP EPKEHPGIVV 
VGDYLFDSTL NGLLDSSDAA TDIILTEMMR LRRARAQAEK PLSDKIDRDY FDNYRGQGPY 
SEAWSQFTDP DYLTSLIKIV WNKGKGKGYK LLVAGSASGE LVGALRDRGI DAWGIENNRY 
IHGKTPKALK KYNKLGTITD LPFKAGEFDF VFETSLCHLG DKQVARAIRE LNRVVKTGLV 
FGSITSDMAP ALVDRYDLLR GVKKLGTWWE WSELFFGNGF DLAMHRRDCT DEVWAATLAA 
NKGPGQWYAD ADSLRYSFFD KVEDDED