Gene Acid345_3521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3521
Symbol
ID	4072780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4165115
End bp	4167025
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	60%
IMG OID	637985544
Product	AMP-dependent synthetase and ligase
Protein accession	YP_592596
Protein GI	94970548
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID	[TIGR02188] acetate--CoA ligase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.728516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.613909
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGG TTGCGCCCGC ACCCGGCGTT CAGAGTTACG TAGCCAAAGA AGAGCAGTAC 
GACGCCCCGC AGATCGTGGT CAAAGAGGCC CTGCTCCAGC ACTGGGACGA GGAATACGCG 
CGCTCGATCG CCGACAACGA CGCCTTCTGG GGCGAATACG CGAAGAACTT TCGCTGGACC 
AAACCATTTC AAACAGTGAG CGAGGCGAAC GGCGCGCACC ACAAGTGGTT TCTCGGCGGC 
AAGACTAACA TCACGCTAAA CGCCCTCGAT CGTCATGCGA AGTCGGAGCG CCGCAATCGA 
GTTGCTTACA TCTGGCTCTG CGAAGACGGC TCAGAGCGGG TCGTGACTTA TGGCCAGCTC 
TATCGCATGG TGTGCCGCTT CGCCAACGGC CTGCGTTCGA TTGACGTCAA CAAGGGCGAT 
CGCGTTGTGA TCTACATGCC GCTCACCATC GAATGCATCG TCGCGATGCT GGCATGCGCC 
CGTGTCGGTG CGATTCACTC GGTTGTCTAT GCAGGTCTGG GTCACCAGGC ACTTCGCGAT 
CGCATTGAAG ATGCGCAGGC GAAGGTCGTC ATCGCCGGTG AATGTACCTA TCGTCGCGGT 
AAGACGGTCG CGTTGAAACC GATCGTGGAT GAAGCGATTG ACGGCCTGGA GTTCGTTGAG 
CACGTCGTCG TGTACCAGCG CAGCAAGGGG CAATTCGAAG CCGCGAGCAG ACGCGAGATC 
GATTTCTTCG CGCTGATGAA GTTTTCCTCG GAATGTCCGG CGGAAGAGAT GGACGCCGAG 
GATCCGCTGT TCATCCTCTA TACCTCGGGA ACCACGGGAA AACCGAAGGG TGTGGTCCAC 
GTCCACGGCG GATTCATGGT TGGCACCACC TATCACCTGC GCAGCTTCCT CGATATCGGC 
GAGCAGGACA TTTTCTGGAA CACTTCGGAC ACCGGCTGGA TCGTTGGCCA CTCCTACATC 
GTGTATGCGC CGCTCTGCGC GGGTGTCACC ACTCTTTTGC GCGAAGGCGC GATTGATTAT 
CCCGAACCCT CTGCGGCGTG GCAGATCATC GAGCGCTACG GCGTGACCAA GATGTTCACG 
GCGCCGACAG CCATCCGCAT GTTTATGCGC TTCGGCGAAT CGCTGCCGTT GTCTTACGAC 
CTGACAACAC TGCGCGTAGT CGCCTGCGCG GGCGAGCCGC TGAATCCCGA AGCTTGGCGC 
TGGGCGCAGA CCTATATCGC CGGCGACGGC AAATGGGGAT ACGTCATTGA TAACTGGTGG 
CAGACCGAAC TCGGCGGTCC GACCCTTGGT ACGCCCGTCA CCAAGGCCAT GCGCGCTGGT 
AAAGCTGGAT TGCCGCTGCC CGGTGTCGAA GCCGACGTGG TGGACATGGA AGGGAAGCGT 
TCGCCCGATG GTGTGCAGGG CCGATTGATC TTGAAACGAC CTTTCCCGCA CATGATGCGC 
ACAATCTGGA AGAACGACGC CCGCTGGGAA CGCGAGTGGC AGGAGATCCC CGGCTGCTAC 
ATGACCGGCG ACGTCGCCGT TCGCGACAAA GATGGCTACA TCGCGGTGAT CGGCCGCGCC 
GACGACGTGC TCAACGTCGC AGGCCACCGT ATTGGTACCG CGGAAGTGGA AAGCGCCTTG 
GTTTCGCACC CGGCGGTTGC GGAAGCCGCA GCGATTGGCA TCCCCGACGC GCTGAAGGGC 
GAGTCCATCA AGGCTTTCGT GCAGCTCCGC GCCGGCCACA ACGCCAGCGA CAACCTGAAA 
GCCGCGCTGG TGGACCACGT TCGCCGCGAA CTTGGCCCGA TCGCCACGCC GTCAGCGATT 
GACTTCGTTC CATCACTACC GAAAACACGA AGCGGCAAGA TCATGCGCCG GTTGTTAAAG 
GCGCGTGAAA CCGGAGCGGA CATCGGCGAT CTTTCGACAC TGGAGCAGTA G

Protein sequence

MSTVAPAPGV QSYVAKEEQY DAPQIVVKEA LLQHWDEEYA RSIADNDAFW GEYAKNFRWT 
KPFQTVSEAN GAHHKWFLGG KTNITLNALD RHAKSERRNR VAYIWLCEDG SERVVTYGQL 
YRMVCRFANG LRSIDVNKGD RVVIYMPLTI ECIVAMLACA RVGAIHSVVY AGLGHQALRD 
RIEDAQAKVV IAGECTYRRG KTVALKPIVD EAIDGLEFVE HVVVYQRSKG QFEAASRREI 
DFFALMKFSS ECPAEEMDAE DPLFILYTSG TTGKPKGVVH VHGGFMVGTT YHLRSFLDIG 
EQDIFWNTSD TGWIVGHSYI VYAPLCAGVT TLLREGAIDY PEPSAAWQII ERYGVTKMFT 
APTAIRMFMR FGESLPLSYD LTTLRVVACA GEPLNPEAWR WAQTYIAGDG KWGYVIDNWW 
QTELGGPTLG TPVTKAMRAG KAGLPLPGVE ADVVDMEGKR SPDGVQGRLI LKRPFPHMMR 
TIWKNDARWE REWQEIPGCY MTGDVAVRDK DGYIAVIGRA DDVLNVAGHR IGTAEVESAL 
VSHPAVAEAA AIGIPDALKG ESIKAFVQLR AGHNASDNLK AALVDHVRRE LGPIATPSAI 
DFVPSLPKTR SGKIMRRLLK ARETGADIGD LSTLEQ