Gene Sked_31020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sked_31020
Symbol
ID	8634735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sanguibacter keddieii DSM 10542
Kingdom	Bacteria
Replicon accession	NC_013521
Strand	-
Start bp	3452866
End bp	3454926
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	70%
IMG OID
Product	flagellar biosynthesis protein FlhA
Protein accession	YP_003315833
Protein GI	269796378
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACC GCGACCTCGC CAAGCTGGCG GTACCCGTCG GGGTGGTCGG CATCGTGATG 
CTGCTCGTCA TCCCGCTGCC CGCCTGGCTG CTCGACGTGC TCATCGTCGT CAACATCGTC 
ATGTCCCTGG TCATCCTGCT GACGACCATG TACGTGCAGC GACCGCTCGA CTTCTCGGTC 
TTCCCCTCGT TGATCCTCGT CGCGACGCTG TTCCGGCTCG GGCTCAACGT GGCCTCGACC 
CGCCTCGTGC TCCGTGACGG CTACGCCGGC GAGGTCATCG ACGCCTTCGG GCACTTCGTG 
GTCGGCGGCT CGCTCATCAT CGGGCTCGTC ATCTTCCTCA TCCTCGTGGT GATCCAGTTC 
GTGGTCATCA CCAACGGTGC CGGGCGCGTG GCCGAGGTCG GCGCCCGCTT CACCCTCGAC 
GCGATGCCCG GCAAGCAGAT GGCCATCGAC GCCGACCTCA ACTCCGGGCT CATCACCGAG 
GACCAGGCGC GCCAGCGCCG CGCGGACGTC GCCGCCGAGG CCGACTTCTA CGGTGCGATG 
GACGGTGGTT CCAAGTTCGT CAAGGGCGAC GCGATCGCCG GCATCATCAT CACCATCATC 
AACCTGGTCG GCGGCATCGC GATCGGCATG ATGCAGCGCG GCATGGAGGT CGGCGAGGCC 
GTCGAGACGT ACTCGCTGCT CACCATCGGC GACGGGCTCG TCACCCAGAT CCCCGCCCTG 
CTGCTCTCGG TGTCCACCGG TCTCATCGTC ACCCGGGCCA CCGCCGACTC CGACCTCGGC 
ACCTCGGCGT CCAAGCAGCT CTCGCAGTCC CGCAACTCGC TGCTCATCGC GGGCAGCGCC 
GCGATCGCCC TCGCGCTCCT GCCCGGCATG CCCAAGCTGC CGTTCATCCT CGTCGGCGCC 
TGCCTGCTGC TGGGTGCCCA GCGCATCAAG GCGCGCGACG CCAAGATCGC CAAGGACGCC 
GAGCTCGACG CCGCCATCCG CGAGACCGTC GCCCCGGTGG CCGACACCCC CGAGAAGCTC 
ATCGAGGACA TGCGGGTCTC CGCCCTCGAG ATCCTGCTCG CGCCCAACCT CGTCGACCTC 
GTGAGCGCCG GCTCTGACGA CGACCTCCTC GCCCGCATCC GGGGCCTGCG CCGCAAGGTG 
GCCCTCGACC TCGGGATCGT GGTCCCGCCG GTGCGCACCC GCGACTCGGT CGAGCTGCCC 
GCGTCGACGT ACGTGCTGCG CATCTCCGGC GTCGAGGCCG CCCGCGGCGA GGTGCCGCCC 
GGCCGGGTCC TCGCCCTCGG CGACGACCTC GGCTCGCTGC CCGGCACCGA GGTCCACGAG 
CCCGTGTTCG GCCTCGCCGG CAAGTGGGTG CCCTCCGAGA TGCGCTTCGC CGCCGAGATG 
ACGGGCGCGA CCGTCGTCGA CCGCGTGTCG GTGCTCATCA CGCACCTGTC GAACGTCATC 
GTCAGCAACG CCGACAGGCT GCTGAGCCGC GAGGACGTCC GCGTGCTCAC GGAGGGCGTC 
AAGCAGGTGA ACCCCGCGGT CGTCGACGAG CTCGTGCCGA ACCTGCTGAC GCTCGGCGAG 
GTGCAGCGCG TGCTCCAGCG GCTGCTCACC GAGCAGGTCC CGGTCCGCGA CCTCGGACGC 
ATCTACGAGG CGCTCACCCT GCGCGCCAAG ATCTCGACCG ACGCCGAGGG CCTCGTCGAG 
GCCGCGCGCC TGCAGCTGGC CCCCGCGATC ACCGCCGCGC ACAGCCACGA GGGCGTGCTC 
CGGGTCATGA CCCTCGAGCC GGTCCTCGAG CAGGCGCTGC TCGAGGGGCT GCGCCCGGGG 
GAGCAGGGCA CCCAGATCCT GCTCGACCCG AACCGCCTCG AGGCCATGCT GCGGTCCTTC 
GCCGCAGGCC GGGCCGCGGC CGAGAGCCAG GGCGTCGACG TGGTGCTCGT GTGCGCCCCG 
GCGCTACGCC CCGCGCTGCG CTCCCTCGTG GCCACCCACC ACGGCGAGGC CCCCGTGATG 
TCATACTCCG AGGTCACCGG ATCCGGTGTG AAGATCGAGG CTGTGGGGGT TGTCCGCGAT 
GTCGAAGCGA TTGCTGCTTG A

Protein sequence

MKNRDLAKLA VPVGVVGIVM LLVIPLPAWL LDVLIVVNIV MSLVILLTTM YVQRPLDFSV 
FPSLILVATL FRLGLNVAST RLVLRDGYAG EVIDAFGHFV VGGSLIIGLV IFLILVVIQF 
VVITNGAGRV AEVGARFTLD AMPGKQMAID ADLNSGLITE DQARQRRADV AAEADFYGAM 
DGGSKFVKGD AIAGIIITII NLVGGIAIGM MQRGMEVGEA VETYSLLTIG DGLVTQIPAL 
LLSVSTGLIV TRATADSDLG TSASKQLSQS RNSLLIAGSA AIALALLPGM PKLPFILVGA 
CLLLGAQRIK ARDAKIAKDA ELDAAIRETV APVADTPEKL IEDMRVSALE ILLAPNLVDL 
VSAGSDDDLL ARIRGLRRKV ALDLGIVVPP VRTRDSVELP ASTYVLRISG VEAARGEVPP 
GRVLALGDDL GSLPGTEVHE PVFGLAGKWV PSEMRFAAEM TGATVVDRVS VLITHLSNVI 
VSNADRLLSR EDVRVLTEGV KQVNPAVVDE LVPNLLTLGE VQRVLQRLLT EQVPVRDLGR 
IYEALTLRAK ISTDAEGLVE AARLQLAPAI TAAHSHEGVL RVMTLEPVLE QALLEGLRPG 
EQGTQILLDP NRLEAMLRSF AAGRAAAESQ GVDVVLVCAP ALRPALRSLV ATHHGEAPVM 
SYSEVTGSGV KIEAVGVVRD VEAIAA