Gene Avin_24090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_24090
Symbol	flgK
ID	7761324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2405266
End bp	2406891
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	66%
IMG OID	643805294
Product	flagellar hook-associated protein
Protein accession	YP_002799571
Protein GI	226944498
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.160366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATTT TCTCCATCGG CGTCAGCGGC CTGAATGCCG CCCAGGTGGC CTTGAGCACC 
ACCTCCAACA ACATCACCAA CGTCTACACG GACGGCTACA ACCGCCAGGT CACCCTGCTC 
GGCGAGAACA ACCTGGGCAA CGGCGTGCAG AGCAACGGCG TGCAGCGCCA GTTCAGCCTG 
TTCGTCGCCA CCCAGCTCAA CCAGTCGACC AGCAATTCCA GCGCGCTGCA GGCCTACGAG 
ACGCAGATCA CCCAGATCGA CAATCTGCTG GCGGACAGCG AGGCGGGCCT GTCCCCCTTG 
CTGCAAAGCT TCTTCTCCTC CCTGCAGGAC CTGGCCTCGG CGCCTTCCGA TCCGGCCGCC 
CGCCAGGGGC TGATCGGCAC CGCCGATACC CTGACCGCGC AGTTCCGCGC TTTCGACGAT 
TACCTGAACG ACATGCAGCA GGGCGTCAAC GGGCAGATCG AGGACGTGGT CTTCCAGATT 
AACAACACCG CCGAGCAGAT CGCCATGCTC AACCGCGAGA TCGGCCTGGC CAAGGCCAAG 
ACCGGCACGG TGCCCAACAG TCTGCTGGAT CAGCGCGACC AACTGGTCGC CGAACTGAGC 
GGCATGGTCG ATGTGGATCT GACCATCCAG GACGGCGGCA GCTACAACAT CAGCATCGGC 
AACGGCCAGG CCCTGGTCTC CGGTACCAAG AGCTTCGCCC TGGAGGCCAT GGCCTCGTCG 
GCGGACCCGA CGCGCACCGT GGTCGGCTAC CGCGACGGCG CCGGCAACCT GCGCGAATTC 
TCCGAAACCG CCTTCGAGGG CGGCGAACTG GGCGGACTGA TGACCTTCCG CCGGGAGACT 
CTGGACAAGA CCCAGAACCA GCTCGGCCAG CTCGCCGTGT CCCTGGCGCA AGGCTTCAAT 
GCGCAGCACA TGGCCGGCGT CGACTACGAG GGCAACCCCG GACAGGCATT CTTCGCCACC 
ACCCAGCCGA CCGTCTACAG CAACGCCAAC AACACCAGCA ACGCCTACCT GGAGGCGGAG 
TTCCTCGCCG ACGTCAGCGG CCTGACCGCC AGCGACTACA CGGTGAAGTA CACCGCCGCC 
GACGGCTATA TGGTGACCCG CAACGACACC GGGGAAGTCG TTGAAACCTT CGCGGCCGGC 
GCCAGCAGCC TGGAGTTCGG CGGCATGAGC GTGACGGTCA ACGGCACCCC GGCCGAGGGC 
GACCGCTTCC TCGTCCAGCC GACCAAGCGC GCCGCCGGCG GGCTCGAAAA CCTGATCCAG 
GATACCTCGC TGATCGCCGC CGGCCAGGAC GACGGCAGCG GCACCGGCAG CGGCGACAAC 
CGCAACGCCC TGGCCCTGCA GAACCTGCAG AACAGCGCGC TGGTCGGCGG TGTCGCCACG 
CTGAGCCAGG CCTACGCCTC GATCGTCGGC GACGTCGGCA ATCGGGCCAA CGTGGTGCAG 
GTCAACCTGG CCGCGCAGCA GGGACTCACC GAGCAACTGC GCGCCCTGCA GCAGTCGGAG 
TCCGGGGTCA ACCTGGACGA GGAGGCGGCC AACCTGATCC GTTTTCAGCA GTATTACCAG 
GCCAGCGCCA AAATCATCGA GGTGGGGGCG ACCGTGCTCG ACACCCTGCT CGGCCTCGAT 
GCCTGA

Protein sequence

MSIFSIGVSG LNAAQVALST TSNNITNVYT DGYNRQVTLL GENNLGNGVQ SNGVQRQFSL 
FVATQLNQST SNSSALQAYE TQITQIDNLL ADSEAGLSPL LQSFFSSLQD LASAPSDPAA 
RQGLIGTADT LTAQFRAFDD YLNDMQQGVN GQIEDVVFQI NNTAEQIAML NREIGLAKAK 
TGTVPNSLLD QRDQLVAELS GMVDVDLTIQ DGGSYNISIG NGQALVSGTK SFALEAMASS 
ADPTRTVVGY RDGAGNLREF SETAFEGGEL GGLMTFRRET LDKTQNQLGQ LAVSLAQGFN 
AQHMAGVDYE GNPGQAFFAT TQPTVYSNAN NTSNAYLEAE FLADVSGLTA SDYTVKYTAA 
DGYMVTRNDT GEVVETFAAG ASSLEFGGMS VTVNGTPAEG DRFLVQPTKR AAGGLENLIQ 
DTSLIAAGQD DGSGTGSGDN RNALALQNLQ NSALVGGVAT LSQAYASIVG DVGNRANVVQ 
VNLAAQQGLT EQLRALQQSE SGVNLDEEAA NLIRFQQYYQ ASAKIIEVGA TVLDTLLGLD 
A