Gene BBta_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4520
Symbol
ID	5151436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4734064
End bp	4735410
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	66%
IMG OID	640559321
Product	hypothetical protein
Protein accession	YP_001240458
Protein GI	148255873
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGACGCG GCTTTGTGAG GACTGTGTCG GCGCTGCTCT GGCGGGGCGT GATCGTCGCC 
GCTCTCGGCG CGATCGGCAT CACCGGGGTG CCGTCAGGCG CAAGTGCGCA GTCGCTCGCT 
GGCGCGGACA CCGTCTATGC CTCGGCTCCG CCGCGACTGC TGCAGATCCG CACCCTCCTG 
GCCGATGCCG GCCGCCAGAC CTCGACCGGC TCCGGCTTTC TGGTCTCGGC CGACGGGCTT 
GCGATCACCA ACTACCACGT GGTCTCCGAC GCGGCGCTCG AGCCGAAGAC CTATCGGCTC 
GAATATACCG GAGCAGATGG CACGCAGGGC GGCGTGACTC TGCTTGCGGT CGATCTGCCC 
AATGATCTCG CACTCGTGCG CGTCGACAAG CACGACGCGC CGTTCTTCAC CTTCGACAAA 
GCGGCGCTCG AGGGCAGCCT GCCCAAGGGC GAGCGTCTCT ATTCGCTCGG CAACCCGCTG 
GACCTCGGCT TTACCATCAT CGAAGGGACC TATAACGGCC TCGTCGAGCA CAGCTACAAC 
GACCATATTC ACTTCACCGG CGCGCTCAAT CCCGGCATGA GCGGCGGTCC CGCCGTGAAC 
GCCCAAGGGC AGGTGGTCGG CGTCAATGTC GCAACGCGAC GCGGCGGTCA GCTGATCAGC 
TTTCTGGTGC CCGCCCGCTT CGCCGCCGCT CTGCTGATCC GCGGCAAGGA CATCAGGCCG 
GAGGCCGCGG ATCTGCGCAA GGACGTCGTT GCCCAGCTCG CCAGCTGGCG CGGCGCGCTG 
TACAAATCCC TGGCCGAGGA AGGCTTCCAT GATCGCGTGT TCGGCTCCTA TCAGGCGCCG 
GAAACGCATG CGGCGTGGTT CGAATGCTGG GCCAGCACCA ATGCCAGCGC CTCGCCGAAG 
CCGCGGGCCA GCATCAATTC GACCAGTTGC AAGGCCGATG CGAGCGTCTA TGTCGCCTCC 
GACCTCAACA CCGGTACGGT CGAAATCAAT CATTCCTACG CGAAGTCGAT CGACCTCAAT 
CAGTTTCAAT TCGCCACCGT GCTGACGCAG CTGGCGCAGC CGCGGCTGAC CTTGGGCGGC 
ACGTTCCGCA AATGGTACAC GCCGCAGCAC TGCCATGAGG ATTTCGTCGG CATCGCGCCG 
CCGGCCGATC ACCCACCGCT GCGCGTGCTC TGGTGCGCGC AGGGCTATCG CGAGTTCGAC 
GGCCTCTATG ACGTCGCGGT TGTCGCGGTC ACGCAGGACC GTGCCGACGA GGCGCTCGTC 
TCCCGCCTGA ATCTGCAGGC GATCGCCTAT GACGACGCGT TGCGGCTCGG CAGGAGCTTT 
CTCGAACGGC TGCAGGTCGC CCGATGA

Protein sequence

MGRGFVRTVS ALLWRGVIVA ALGAIGITGV PSGASAQSLA GADTVYASAP PRLLQIRTLL 
ADAGRQTSTG SGFLVSADGL AITNYHVVSD AALEPKTYRL EYTGADGTQG GVTLLAVDLP 
NDLALVRVDK HDAPFFTFDK AALEGSLPKG ERLYSLGNPL DLGFTIIEGT YNGLVEHSYN 
DHIHFTGALN PGMSGGPAVN AQGQVVGVNV ATRRGGQLIS FLVPARFAAA LLIRGKDIRP 
EAADLRKDVV AQLASWRGAL YKSLAEEGFH DRVFGSYQAP ETHAAWFECW ASTNASASPK 
PRASINSTSC KADASVYVAS DLNTGTVEIN HSYAKSIDLN QFQFATVLTQ LAQPRLTLGG 
TFRKWYTPQH CHEDFVGIAP PADHPPLRVL WCAQGYREFD GLYDVAVVAV TQDRADEALV 
SRLNLQAIAY DDALRLGRSF LERLQVAR