Gene BBta_5528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5528
Symbol
ID	5150513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5743312
End bp	5744856
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	64%
IMG OID	640560272
Product	putative flagellin protein, C-terminus
Protein accession	YP_001241394
Protein GI	148256809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.757214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGGTA TTGTTCTCTC GGCGTCGGTG CGCCAGAATC TGCTCTCGCT CCAGTCGACG 
GCTCAGCTCC TCGCCACCAC CCAGAACAAC CTCGCCACGG GCAAGAAGGT CAACTCGGCA 
CTCGATAATC CGACCAACTT CTTCACCGCC CAGGGCCTCG ATAACCGCGC TTCCGACATC 
TCCAATCTGC TCGATGGCAT CGGCAACGGC GTGCAGGTTC TGCAGGCCGC CAACACCGGC 
ATCACCTCGC TGCAGAAGCT CGTCGACAGC GCCAAGTCGA TTGCCAACCA GGTGCTGCAG 
AGCTCGGTCG GCTACTCCAC CAAGTCGAAC GTGACCTCGG CAGCGCTGGC CGGTGCGACC 
GCCTCGAGCC TGATTGGCGC CAGCACCACC GCCGTCACCG GTTCCGTCGT GCTGAACGAC 
AACACTTCGA GCGCGGTGGC GATCACCGGC ACGACCAAGC TGTCGGGTAC GCCGGGCACC 
TCGTCGAACG ACTTGGCCTC CAGCATCACC ACCGGCGACA CGCTGGTTGT GAACGGCACC 
ACCTTCACCT TTATCGCCGG CACGTCCTCG TCCGGCACCA ATATCGGCGT CGGTGACACC 
GTTACGAACC TGCTGTCGAC CATCCAGAGC GCGACCGGCG TGACCTCGTC GATCACGGCG 
GGCGCGATCA CGCTGACGCC GCCGGCGGCA GGCCTGACAT TGTCCGGTAC GTCGCTGGCC 
AAGCTCGGTC TCAGTGCGGT CGGCAATTCG CTGTCCGGGC AGACGCTGAC AATCGCCGCC 
ACAGGAGGTG GCACGGCGAC CAGCATCACG TTCGGATTGG GAACGGGACA GGTCAACTCG 
CTGAACGACC TCAACACGAA GCTTGCGGCC AACAACCTGC AGGCCTCGTT CGACACGTCG 
TCCGGCAAGA TCTCGATCAC CACGACCAAT GATGCGGCCT CGGCGACGAT CGGTGCGATC 
GGTGGTACGG CGGCGGCGTC CAGCCAGTCC TTCAACGGTC TTACGGCGGC GGCTCCGGTG 
GCCGATGCGA CTGCACAGTC GCAGCGGTCG AGCCTGGTCG CGCAGTACAA CAACGTGCTG 
CAGCAGATCA ACACCACCGC AGCCGACGCC TCGTTCAACG GCGTCAACCT GCTCAACGGC 
GACACGCTGA AGCTCACCTT CAACGAGACC GGCAAGTCCT CGTTGTCGAT CACCGGTGTG 
ACCTTCAACA TCGCAGGTCT CGGCCTGTCG AACCTGACTG CGGGCACCGA CTTCCTCGAC 
AACAACTCGG CGAACAAGGT GCTGAACGTG CTCAACACGG CCAGCTCCAC GCTGCGGTCG 
GAGGCGTCGA CCCTGGGTTC GAACCTGTCG GTCGTGCAGA TCCGTCAGGA CTTCAACAAG 
AACCTGATCA ACGTGCTGCA GACCGGCTCG TCGAACCTGA CTCTGGCCGA CACCAACGAG 
GAAGCGGCCA ATAGCCAGGC GCTGTCGACC CGCCAGTCGA TCGCGGTGTC CGCGCTGTCG 
CTCGCCAACC AGTCGCAGGC GAGCGTGCTG CAGCTGCTGC GCTGA

Protein sequence

MSGIVLSASV RQNLLSLQST AQLLATTQNN LATGKKVNSA LDNPTNFFTA QGLDNRASDI 
SNLLDGIGNG VQVLQAANTG ITSLQKLVDS AKSIANQVLQ SSVGYSTKSN VTSAALAGAT 
ASSLIGASTT AVTGSVVLND NTSSAVAITG TTKLSGTPGT SSNDLASSIT TGDTLVVNGT 
TFTFIAGTSS SGTNIGVGDT VTNLLSTIQS ATGVTSSITA GAITLTPPAA GLTLSGTSLA 
KLGLSAVGNS LSGQTLTIAA TGGGTATSIT FGLGTGQVNS LNDLNTKLAA NNLQASFDTS 
SGKISITTTN DAASATIGAI GGTAAASSQS FNGLTAAAPV ADATAQSQRS SLVAQYNNVL 
QQINTTAADA SFNGVNLLNG DTLKLTFNET GKSSLSITGV TFNIAGLGLS NLTAGTDFLD 
NNSANKVLNV LNTASSTLRS EASTLGSNLS VVQIRQDFNK NLINVLQTGS SNLTLADTNE 
EAANSQALST RQSIAVSALS LANQSQASVL QLLR