Gene Gdia_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3478
Symbol
ID	6976930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3808810
End bp	3810321
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	63%
IMG OID	643392999
Product	flagellar hook-associated protein FlgK
Protein accession	YP_002277818
Protein GI	209545589
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.109948
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTGC TGTCATCGCT GTCAACGGCC ACCAGCGGAC TGAACGGGAT CGAGTATCAG 
TTGGGCGTGC TGTCCAATAA CGTCTCGAAC TCGAGCACCA CGGGATATGT CAGCGAGACG 
GCCGAGGTAT CGTCGGCCGT GGCGGGTGGC GTCGGGGTCG GTATCAAGAT CGGCACGACG 
CAACTGAGTG TGAACAAGGC CCTGATGGCC GCTCTTTACG GACAGAATGC GCAGGTGGCG 
TCGTTGACGG CGACGAACAA CTCGCTGGCG GCGGTTTCAG ACATCCAGGG ATCGACATCG 
GCGGATGCGG GAAGCACGAC CACGTTGGCC GACGAACTTG GCAATGTGCA AAGCGCCCTC 
ACGACCCTGA CCTCGACCCC CACGAACAGC GCGTCGCAAT CGGCCGTGTA TTCCGCCGCG 
CAATCCCTGA CCACCACCAT CCAGTCGCTT TCCTCGACCT ATACGGCCCA GCGCCAGGAC 
GCCGAAAACA GCGTTGTCTC GACGGTATCC TCCGTCAATT ACGACCTGAC GCAGCTCGGG 
CAGCTCTCGC AGCAGATCAT GAGCCTGCGG GCCAGCGGAG GAAGCACCGC CGACGTCGAG 
AACCAGCGTC TGCAGGTGAT GTCGAGCCTG TCGTCCGAAC TTTCGGTCAC GTTTTCCGAG 
ACGTCGACCG GCGACATGAT CGTCCGGACC GCCGATGGAA CCGAGCTTCC GACCCGTCCC 
GACCAGATCG GGGAAAATGA CAGCACGGTC ACGCTGCCCA CCAGCACATG GCCGCTTTCG 
ACATCCGGCA GCACCATTAC CCCATCGTCG TACTACCAGG CTGGAGATAC CAACTCGACG 
ATCTCCGGGA TCATGCTGAA CGGCACGGAC ATCACCGCGC ATCTGACCGG TGGAACGCTC 
GGAGCGAACA TCACGCTGCG CGACAGCACG TATCCGACGA TGCAGGCCCA GCTGGACTCG 
TTTTCTTCCA CGCTCGCGAC CCGGTTTTCC GATGCCGGGC TTTCGCTGTT CACCGATGGT 
ACGGGGGCTG TTCCGGCAAC GGACCCGACG GCAGAGACGC CCAGCGGCAT CGTCGGCCTG 
TCGTCGGTGA TCAGCGTGGA TACGTCCGCG CCGCTGACGA CGGACGGCGA TACGTCGACG 
ATTACGGCGG TCCTCAGCAC GGCTTTCGGA ACCGCTTCGA CGGATGTGAG CGGTTCGCTT 
GAAGCGCCGT CAAGCGGCCT TGGACCGGAG GGCAATCTGT CGACCGGATA TTCGGGCACC 
CAGGGACTGG TGGCCCTTGC CACGTCCCTG ACCTCGGCCC AGGGCGCGGT CATCGGCGAC 
GCCACCGACG ATCTGACGTC CGCTACCTCG GTGCAGACAA CGTTGCAGAC GTCTGTCGCC 
AACGTGTCCG GCGTAAACGT GGACGATCAG ATGTCGACGG TCGTCGCGCT GCAGAACGCC 
TACGCGGCCA ATGCGAAAGT GGTGACCGCG GTGCAGACGA TGTTCACCGC GCTTCTCGAC 
GCGATCCAAT AG

Protein sequence

MDLLSSLSTA TSGLNGIEYQ LGVLSNNVSN SSTTGYVSET AEVSSAVAGG VGVGIKIGTT 
QLSVNKALMA ALYGQNAQVA SLTATNNSLA AVSDIQGSTS ADAGSTTTLA DELGNVQSAL 
TTLTSTPTNS ASQSAVYSAA QSLTTTIQSL SSTYTAQRQD AENSVVSTVS SVNYDLTQLG 
QLSQQIMSLR ASGGSTADVE NQRLQVMSSL SSELSVTFSE TSTGDMIVRT ADGTELPTRP 
DQIGENDSTV TLPTSTWPLS TSGSTITPSS YYQAGDTNST ISGIMLNGTD ITAHLTGGTL 
GANITLRDST YPTMQAQLDS FSSTLATRFS DAGLSLFTDG TGAVPATDPT AETPSGIVGL 
SSVISVDTSA PLTTDGDTST ITAVLSTAFG TASTDVSGSL EAPSSGLGPE GNLSTGYSGT 
QGLVALATSL TSAQGAVIGD ATDDLTSATS VQTTLQTSVA NVSGVNVDDQ MSTVVALQNA 
YAANAKVVTA VQTMFTALLD AIQ