Gene Acid345_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3520
Symbol
ID	4072779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4163044
End bp	4165002
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	60%
IMG OID	637985543
Product	acetyl-coenzyme A synthetase
Protein accession	YP_592595
Protein GI	94970547
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID	[TIGR02188] acetate--CoA ligase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.877944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.990981
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCAG CCACGCACTC CAATATTGAT TCCATTCTTC AGGAAAATCG CAAATTCGAA 
CCGCCTGCTG AGTTCAGCCG TCACGCCCAC ATCAAGTCGC TCGAGGAATA CGAGAAACTC 
TACAAGCAGG CCGCTGACGA CCCTGAAGGA TTTTGGGCTG AAGTCGCGAA GGAACTGCAC 
TGGTTCAAGC CGTGGACCAA AGTTCTGGAG TGGGACGCAC CCTGGGCGAA GTGGTTCGTC 
GGCGCTGAGG CCAACCTTTC CTACAACTGT CTCGACCGCC ACGTGCTCGG CGGACGCCGC 
CACAAGGCCG CGTTCATTTG GGAAGGCGAA CCCGGCGACG TGCGCACGCT GACCTATCAG 
CAGCTCTGGC TCGAAGTGCA GAAGTTCGCC AACGTTCTGC TGGATCTTGG GATCAAGAAG 
GGTGATCGCG TTGCGATTTA TATGGGTATG GTGCCGGAAC TGCCCGTTGC GATGCTCGCC 
TGCGCGCGCA TCGGCGCGAC GCACTCCGTG ATCTTCGGTG GCTTTTCGGC GAACGCGCTG 
GTGGACCGCA TCACCGACCA GCAGGCCGTC GCCGTCATTA CGCAGGATGG CTCATGGCGT 
CGCGGCAACG AAGTGAAGTT GAAAGTCGCA GTAGACGAGG CGCTGGAAAA GTGCCCAACC 
GTGAAACACG TCGTGGTCTA TAAGCGCACG GCAAGCGCCA TCAACATGAA AGAGGGTCGC 
GACCACTGGT GGCACGATCT CATGGCGAAG GCGAAGGACC ACTGCCCCGC CGAGCCGCTC 
GACGCCGAGC ATCCGCTCTA CATCCTCTAT ACGTCGGGGA CCACCGGCAA GCCGAAGGGA 
ATCGTCCACA CCACTGGCGG CTACGCAGTC GGCACCTACT ACACGACCAA GATGGTCTTC 
GATCTCAAGG AAGACGATAC CTTCTGGTGC ACTGCCGATA TCGGTTGGGT CACGGGCCAC 
AGCTACATCG TTTACGGTCC GCTGCAAACC GGCGCCACGA CGGTGATGTA CGAAGGCGCG 
CCGAACTTCC CGGACCTCGA TCGTTTCTGG GCGCTCGTCG CCAAGCACAA GGTCACCGTC 
TTCTACACCG CCCCGACCGC GATTCGCACC TTCATGAAGT GGGGCGCGGA ATATCCCAAC 
CGTCATGACA TGAGCACTCT AAGATTGCTC GGCAGCGTTG GTGAGCCGAT CAACCCCGAA 
GCCTGGATGT GGTACCGCGA CGTCATCGGG AAAGATCGTT GTCCGATCGT TGATACCTGG 
TGGCAGACCG AGACTGGCGC CATCATGATC TCGCCGCTGC CTGGCGCGAT CGCCACCAAG 
CCGGGTTCGG CGACCAAGCC GCTGCCCGGA ATCATCGCGG AAGTCGTAAC CCGTGCCGGC 
GAGAAAGTAC CGCTCGGCTC GGGCGGGTTC CTCGTCATCA AGAAACCGTG GCCCTCGATG 
ATGCGCACCA TCTACGGCGA TCCCGAGCGC TACAAGCACC AGTATTGGTC TGATATTCCG 
GGCGTGTACT TCACGGGTGA TGGTGCTCGC GAAGACAAGG ACGGCTACTT CTGGATCATG 
GGTCGCGTGG ACGACGTGCT GAACGTCTCC GGCCATCGCC TGAGCACCAT GGAAATCGAG 
TCCGCGCTGG TGGCACATCC GAAGGTCGCG GAAGCCGCGG TCGTTGGCCG CCCAGACGAG 
ATGAAAGGTC AGGCAGTATC GGCGTTCGTC ACGCTGGAAT CCGGTAGCAA GCCCTCGCCT 
GAACTGAAGG AAGAACTCCG CGCCTGGGTA GCCAAGGAAA TCGGTTCCAT GGCGAAGCCC 
GATGACATCC GCTTTACGGA CACGCTCCCC AAGACCCGCA GCGGCAAGAT CATGCGCCGT 
CTGCTCCGTG AACTGGCAAC GGGAGGCGAT GTAAAGGGCG ACACCACGAC CTTGGAAGAT 
TTCACCGTCA TCGCCAAGCT CAAGGAAGAT GAACAGTAG

Protein sequence

MSSATHSNID SILQENRKFE PPAEFSRHAH IKSLEEYEKL YKQAADDPEG FWAEVAKELH 
WFKPWTKVLE WDAPWAKWFV GAEANLSYNC LDRHVLGGRR HKAAFIWEGE PGDVRTLTYQ 
QLWLEVQKFA NVLLDLGIKK GDRVAIYMGM VPELPVAMLA CARIGATHSV IFGGFSANAL 
VDRITDQQAV AVITQDGSWR RGNEVKLKVA VDEALEKCPT VKHVVVYKRT ASAINMKEGR 
DHWWHDLMAK AKDHCPAEPL DAEHPLYILY TSGTTGKPKG IVHTTGGYAV GTYYTTKMVF 
DLKEDDTFWC TADIGWVTGH SYIVYGPLQT GATTVMYEGA PNFPDLDRFW ALVAKHKVTV 
FYTAPTAIRT FMKWGAEYPN RHDMSTLRLL GSVGEPINPE AWMWYRDVIG KDRCPIVDTW 
WQTETGAIMI SPLPGAIATK PGSATKPLPG IIAEVVTRAG EKVPLGSGGF LVIKKPWPSM 
MRTIYGDPER YKHQYWSDIP GVYFTGDGAR EDKDGYFWIM GRVDDVLNVS GHRLSTMEIE 
SALVAHPKVA EAAVVGRPDE MKGQAVSAFV TLESGSKPSP ELKEELRAWV AKEIGSMAKP 
DDIRFTDTLP KTRSGKIMRR LLRELATGGD VKGDTTTLED FTVIAKLKED EQ