Gene Acid345_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4033
Symbol
ID	4071172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4767751
End bp	4768962
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	60%
IMG OID	637986063
Product	threonyl/alanyl tRNA synthetase, SAD
Protein accession	YP_593107
Protein GI	94971059
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0013] Alanyl-tRNA synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.22843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAAC GGCTTTATTA CAACAATAGT TTCTTGCTGA ACTTTACGGC GGCGGTGCTG 
GACGCGCGTG TGGAGGACGG GCGCGCGATC GTCGTGCTCG ACCGGACGGC GTTTTATCCA 
ACGAGCGGTG GGCAGATTTT TGATACCGGC TGGATGGAGT TGGAGAAGGA CGCGCGGAAG 
TTGCGCGTGA GTGAAGTCGG CGAGACGGAA GAAGGCGTCA TTCAGCATTA CGTGGACACG 
TCGGATGTAG AGACGCTGAA AGACGGGCGG GTCCGCGGGT TCATTGACGT GGAGCGGCGT 
CGCGACCACA TGCAACAGCA CACGGGGCAG CACGTGTTGT CGTCGGCGTT CGAGTCGTTG 
TTTGAGATGA AGACGGTGTC GTTCCATATG GGCGCGGAGA GTTGCACCAT CGATCTCGAT 
ACCAAGGCCC TGGCGCCGGA ACAAGTGAAG AAAGCCGAGG CCGTGGCCAA TGAGGTGATC 
GCCGAGGACC GTCCGGTGGA GATCAAGTAC GCGACGGTGG ATGAGGCGCG TGCGATGGGG 
GTGCGGAAGA TTCCACCGGC GGAGCGCGAG AAGCTGCGGC TGATTGATAT CAAAGATTTC 
GATCTGAATG CATGCGGTGG AACCCATGTG CGTGCGACGG GACAGATCGG GGGACTCCTG 
ATCCGGAAGA TCGCGAAGGA GAAGCAGGGG TTTCGGGTGG AGTTTGTCTG CGGCGGACGC 
GCGGTGAACA CGGCGCGCAG GGATTTCGAA ACGCTCACAG ACGCAGCGAC TTTGTTCTCA 
AGCCACATCT ACGATGTGCC GGTGCAGGTG CGGAAGCTGA TTGAAGAAAA CAAGGCAGGA 
ACGAAGCGCG AGCACAAACT GCTGGAAGAA GTCGCGTCGC TCACGGCGGA CGTGATGCTG 
GCGCAGCTCG GTGACAAGAA GGTCGTGAGG CAGTTTTACA CGGACCGGGA TATGACGTTC 
ATCAAGCTTC TGGCGCAGCG CCTGACCCGA CAGGGAAGCG TGGTGGCATT GCTTGGGTGC 
GGGGGCACGC AGCCCGCCGT TATATTCGCC CAGACTTCCG GGCTCCCGAA TGACATGGGT 
GGGCTGATGA AAGAGGCGCT GGTGGAACTT GGCGGGCGCG GTGGCGGGAA CAAAGATATG 
GCGCAGGGCG GAGCTACGGA CGCGTCTAAG ATAGAGGCGG TACTGGAGAA GATCGCAGGC 
AGAATCGCGT AA

Protein sequence

MTERLYYNNS FLLNFTAAVL DARVEDGRAI VVLDRTAFYP TSGGQIFDTG WMELEKDARK 
LRVSEVGETE EGVIQHYVDT SDVETLKDGR VRGFIDVERR RDHMQQHTGQ HVLSSAFESL 
FEMKTVSFHM GAESCTIDLD TKALAPEQVK KAEAVANEVI AEDRPVEIKY ATVDEARAMG 
VRKIPPAERE KLRLIDIKDF DLNACGGTHV RATGQIGGLL IRKIAKEKQG FRVEFVCGGR 
AVNTARRDFE TLTDAATLFS SHIYDVPVQV RKLIEENKAG TKREHKLLEE VASLTADVML 
AQLGDKKVVR QFYTDRDMTF IKLLAQRLTR QGSVVALLGC GGTQPAVIFA QTSGLPNDMG 
GLMKEALVEL GGRGGGNKDM AQGGATDASK IEAVLEKIAG RIA