Gene Acid345_3860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3860
Symbol
ID	4071012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4570109
End bp	4571188
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	60%
IMG OID	637985884
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_592934
Protein GI	94970886
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.968888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACA TGAGCAAAGA ACGCGTGTTG AGTGGGATGC GTCCCACCGG GAAGCTGCAC 
CTGGGGCACT ATGTCGGCGC CCTTCAGAAC TGGGTGAAGT TGCAGGAGCA GTACGACTGT 
TTCTATTTCG TCGCCGATTG GCACGCGCTG ACCACGAACT ACGCCGATAC CTCCGACATC 
AAGGCGAGTT GCATTGAACT GATCATCGAC TTCCTCTCCG CCGGACTCGA TCCCGAGAAG 
TCCACGCTGT TCATCCAGTC ACACGTGCCG CAGCATGCCG AGTTGTACCT GCTGCTGTCG 
ATGATCACGC CGCTCGGCTG GCTCGAGCGT GTCCCCACGT ACAAGGAACA GCTGGAGAAC 
ATCAAGGACA AAGACCTCGG GATGTACGGC TTCCTCGGCT ACCCCGCGCT GCAAACCGCC 
GACATCATCA TCTACAAGGC CAAGTATGTA CCGGTAGGCC AGGACCAGGT GCCGCACCTC 
GAGATCAGCC GGGAAATCGC GCGTCGCTTC CACCAGTTCT ATCCGCGCAA AATGCACGCC 
GGCATTGCCG CTCCGGAGCG CGACTACGTT TTTCCCGAGC CCAAGCCGCT GCTTACGCCG 
GCTGCAAAAC TGCCCGGCAC CGACGGCCGC AAGATGTCGA AGTCGTACGG CAACAGTATT 
CTGCTCAGCG ATCCGGAAGC GGAAATTCGC GCAAAGCTGA AGACCATGGT CACCGACCCA 
GCGCGCGTGC GCCGCACCGA TCCCGGCAAT CCGGATGTGT GCCCGGTCGG CGACCTGCAT 
AAAATCTTCA GCGACGCCGA GACCATGGCG AAGGTGAACG AAGGCTGCCG TACCGCTGGG 
ATTGGCTGCA TCCAGTGCAA AGGATGGGCC GCCGACTCCA TCGTGAGAGT CCTGGCTCCG 
ATTCAAGAGC GCCGCGCGAA ATACGAGGGC AATCCGAAGA TGGTCTGGGA TATCCTCGAA 
GCCGGCTCGG CGAAGGCACG CGTTGCCGCC GAGGCCACAA TGGTCGAAGT GCGCGAGGCG 
ATGGGAATGT CACACCAGTA CGAAGCGCCG AACACGTCGG CAGCAGCGGA GTCGAAGTAA

Protein sequence

MSNMSKERVL SGMRPTGKLH LGHYVGALQN WVKLQEQYDC FYFVADWHAL TTNYADTSDI 
KASCIELIID FLSAGLDPEK STLFIQSHVP QHAELYLLLS MITPLGWLER VPTYKEQLEN 
IKDKDLGMYG FLGYPALQTA DIIIYKAKYV PVGQDQVPHL EISREIARRF HQFYPRKMHA 
GIAAPERDYV FPEPKPLLTP AAKLPGTDGR KMSKSYGNSI LLSDPEAEIR AKLKTMVTDP 
ARVRRTDPGN PDVCPVGDLH KIFSDAETMA KVNEGCRTAG IGCIQCKGWA ADSIVRVLAP 
IQERRAKYEG NPKMVWDILE AGSAKARVAA EATMVEVREA MGMSHQYEAP NTSAAAESK