Gene Bind_3556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3556
Symbol	flgK
ID	6200698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	4035661
End bp	4037142
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	53%
IMG OID	641707512
Product	flagellar hook-associated protein FlgK
Protein accession	YP_001834602
Protein GI	182680456
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.83285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGA CTTCCGCAAT GGGTGTTACA CAATCGGCGC TGTCTGCATT CAGTGCCGAG 
ACATCGGTCA CCTCGCGTAA TATAGCGGGG GCGAATAGCA CCGGTCTTTA TTCTCGTAAA 
TCGATCGATG TCGTCAGTTC CAACAATAGC GGGGTCGAGG TTCTGTCCGT GACTCGGGCG 
CAGAATCAGG CTCTCTTCGG TGATTTGCTG GGCTCGACGG CTGTGAGCGC AAAGCAGGAT 
GCGCTATCAT CGGGGCTTGA TGCTCTCTAT CAAACGATTG GCGATACAAC CGACTCTATT 
TCACCGGCGG CGCTTCTAAG CAATCTGCAA AATTCCTTGC AGACACTTGC CGCTTCGCCA 
AGTGACATGG TTCAGGCGCA AGATGTCGTC GGTAAAGCGC AAGCTTTGAC GGACGGATTG 
AACAATGCGT CTTCAACTGT CCAATCGGTT CGTCAGCAAG CCGACGGTAA TATGGCGAGC 
TCGGTATCGA CGATCAATTC CCTGCTGGGG CAATTTCAAA CGCTCAATAC GCAAATCGTC 
AGCGGGGGCA AGAGTGGCGC CGATGTGACA GATCTGCTGG ATTCGCGGGA TAATATTCTG 
CAACAATTGT CGCACCAAGT CGGTATTACG ACGACATCGA ATTCCGACAA TAGTATGTCG 
ATTTTTACCG ATAGCGGTGT CACCTTATTT CAAGACAAAG CCAGGACGGT AACTTTCGTA 
CCAACGACGA CTTACGTGGC CGGCACTATC GGCAATAGTG TAATGGTCGA TGGCGTGCCG 
ATTACCGGCA AATCCTCACC CATGCCGATA CAATCGGGGA AATTGGCAGG TCTTGCTGAT 
TTGCGCGATA ATGTCACAAC GACCTATCAG GCTCAACTGG ATGGGATCGC GGGGACTCTT 
ATCAACGCAT TTGCCGAAAG CGATCAATCC GGTGCGACAC CACCGGCTGC AAGTCAGCCG 
GGTTTGTTTA CCTATTCGGG AGCGCCCGCT CTCCCTTCCA GCCTGAATAT GACAGGATTG 
GCCGCCGGCA TCAGGGTTAA TTCCAACGTC GATCCTAAGC AGGGTGGGAA TCTGACCTTG 
CTTCGAGACG GCGGCATTTC CGATCCAGCC AGCACGACCT ACACGTATAA TACGACTGGC 
GCGGCAAGTT ATGTCGGGCG ACTGAACGGA ATGCTTGCGG CCTTCGATCA GACGCAGAGT 
TTTTCGAATG CTGCGAATCT GTCGACCAGC AGTAGTCTAA CCGATTTTTC GACAGCCTCA 
GCCGCTTGGC TGAATGGTCA GCGTCAAAGC GCCTCCACGG CAAGTGATTA CCAAAAGACC 
GTGGTCAGTT CCGTGACGAG CGCATTGTCC AATGCGACCG GGGTTAGCCT CGACACGGAA 
ATGTCGAAAA TGCTGGATTT GGAGCAATCC TATTCGGCCT CGGCGAAGTT AATGTCGACC 
ATCAATACGA TGTTTCAATC CCTTTTGACT GCTGTGGGGT GA

Protein sequence

MSLTSAMGVT QSALSAFSAE TSVTSRNIAG ANSTGLYSRK SIDVVSSNNS GVEVLSVTRA 
QNQALFGDLL GSTAVSAKQD ALSSGLDALY QTIGDTTDSI SPAALLSNLQ NSLQTLAASP 
SDMVQAQDVV GKAQALTDGL NNASSTVQSV RQQADGNMAS SVSTINSLLG QFQTLNTQIV 
SGGKSGADVT DLLDSRDNIL QQLSHQVGIT TTSNSDNSMS IFTDSGVTLF QDKARTVTFV 
PTTTYVAGTI GNSVMVDGVP ITGKSSPMPI QSGKLAGLAD LRDNVTTTYQ AQLDGIAGTL 
INAFAESDQS GATPPAASQP GLFTYSGAPA LPSSLNMTGL AAGIRVNSNV DPKQGGNLTL 
LRDGGISDPA STTYTYNTTG AASYVGRLNG MLAAFDQTQS FSNAANLSTS SSLTDFSTAS 
AAWLNGQRQS ASTASDYQKT VVSSVTSALS NATGVSLDTE MSKMLDLEQS YSASAKLMST 
INTMFQSLLT AVG