Gene EcSMS35_1494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1494
Symbol	fadK
ID	6143828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1478190
End bp	1479830
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	50%
IMG OID	641616372
Product	short chain acyl-CoA synthetase
Protein accession	YP_001743552
Protein GI	170680187
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.433242
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGA CATTAACGTT TAACGAACAA CGTCGTGCGG CGTATCGTCA GCAAGGGCTA 
TGGGGCGATG CTTCGCTGGC CGATTACTGG CAGCAGACCG CTCGTGCGAT GCCAGACAAA 
ATTGCCGTGG TCGATAATCA TGGTGCATCA TACACCTATA GCGCGCTCGA TCACGCCGCG 
AGCTGTCTGG CAAACTGGAT GTTGACGAAG GGTATTGAAT CAGGCGATCG CATCGCATTT 
CAACTGCCTG GCTGGTGTGA ATTTACCGTT ATCTATCTTG CCTGCCTGAA AATCGGTGCG 
GTTTCCGTAC CGCTGTTGCC TTCCTGGCGG GAAGCAGAAC TAGTATGGGT ACTCAATAAG 
TGTCAGGCAA AAATGTTCTT TGCACCGACG TTGTTTAAAC AAACGCGTCC GGTAGATTTA 
ATCCTGCCGC TGCAAAATCA GCTTCCACAA CTACAACAAA TTGTCGGCGT GGACAAACTG 
GCTCCCGCCA CCTCTTCCCT CTCATTAAGT CAGATTCTCG CCGACAATAC CCCACTGACT 
ACGGCGATAA CGACCCACGG CGATGAATTA GCCGCTGTGC TATTTACCTC CGGAACCGAG 
GGTCTGCCAA AGGGCGTGAT GCTAACGCAT AACAATATTC TCGCCAGTGA GCGGGCTTAT 
TGCGCGCGGC TGAATCTGAC CTGGCAGGAT GTCTTTATGA TGCCTGCGCC ACTTGGTCAC 
GCAACGGGCT TTCTGCATGG CGTAACAGCA CCATTTTTAA TTGGTGCTCG CAGCGTGTTG 
TTAGATATTT TCACTCCTGC TGCGTGTCTC GCGCTGCTTG AGCAGCAGCG TTGCACCTGT 
ATGCTCGGCG CAACGCCGTT TGTCTATGAT CTTTTGAATT TACTAGAGAA ACAGCCCGCA 
GACCTTTCAG CGCTGCGTTT CTTTCTTTGT GGCGGTACCA CAATCCCCAA AAAAGTGGCG 
CGTGAATGCC AGCAGCGCGG CATTAAATTA TTAAGTGTTT ATGGTTCCAC AGAAAGTTCG 
CCGCATGCGG TGGTGAATCT CGATGATCCT TTGTCGCGCT TTATGCACAC CGATGGTTAC 
GCTGCCGCAG GTGTAGAGAT TAAAGTGGTC GATGGCGCAC GCAAGACCTT ACCGCCAGGT 
TGCGAAGGTG AAGAAGCCTC GCGTGGCCCC AATGTGTTTA TGGGGTATTT TGATGAACCT 
GAATTAACCG CCCATGCCCT GGATGAAGAA GGCTGGTATT ACAGCGGCGA TCTCTGCCGC 
ATGGATGAGG CTGGCTATAT AAAAATAACC GGGCGCAAGA AAGATATTAT TGTCCGCGGC 
GGCGAAAATA TTAGCAGCCG TGAAGTGGAA GATATTTTAT TACAGCATCC TAAAATTCAC 
GATGCTTGTG TGGTTGCGAT GCCCGATGAA CGCTTAGGTG AACGTTCATG CGCTTATGTC 
GTGCTGAAAG CACCGCATCA TTCATTATCG CTGGAAGATG TAGTGGCATT TTTTAGCCGT 
AAACGGGTCG CGAAATATAA ATATCCTGAA CATATCGTGG TAATCGAAAA ACTACCGCGC 
ACTGCCTCCG GTAAAATACA AAAATTTTTG TTACGTAAAG ATATTCTTCA ACGGCTGGAA 
CAAACATGCG TTGAGGCATA A

Protein sequence

MKVTLTFNEQ RRAAYRQQGL WGDASLADYW QQTARAMPDK IAVVDNHGAS YTYSALDHAA 
SCLANWMLTK GIESGDRIAF QLPGWCEFTV IYLACLKIGA VSVPLLPSWR EAELVWVLNK 
CQAKMFFAPT LFKQTRPVDL ILPLQNQLPQ LQQIVGVDKL APATSSLSLS QILADNTPLT 
TAITTHGDEL AAVLFTSGTE GLPKGVMLTH NNILASERAY CARLNLTWQD VFMMPAPLGH 
ATGFLHGVTA PFLIGARSVL LDIFTPAACL ALLEQQRCTC MLGATPFVYD LLNLLEKQPA 
DLSALRFFLC GGTTIPKKVA RECQQRGIKL LSVYGSTESS PHAVVNLDDP LSRFMHTDGY 
AAAGVEIKVV DGARKTLPPG CEGEEASRGP NVFMGYFDEP ELTAHALDEE GWYYSGDLCR 
MDEAGYIKIT GRKKDIIVRG GENISSREVE DILLQHPKIH DACVVAMPDE RLGERSCAYV 
VLKAPHHSLS LEDVVAFFSR KRVAKYKYPE HIVVIEKLPR TASGKIQKFL LRKDILQRLE 
QTCVEA