Gene Slin_2008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2008
Symbol
ID	8725746
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	2423506
End bp	2424870
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	50%
IMG OID
Product	histidyl-tRNA synthetase
Protein accession	YP_003386852
Protein GI	284036922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAC CAACATTGCC GAAAGGTACC CGTGACTTTG GGCCGGAGCA GATGCGTAAA 
CGGCTTTTTA TTTTTGATAC AATTCGCCAG ACATTTCAAC GATTTGGTTT TCAGCCCATA 
GAAACGCCAT CCCTGGAAAA CCTGTCTACC CTGACGGGTA AATACGGGGA GGAAGGTGAC 
CAGCTTCTCT TCAAAATTCT TAATTCAGGT GATTTTGCTG CGGGAATTAC CGAACTCGAT 
CTGGCCTCGG GGTCAAAGAA GTTAACCCCG AAAATTGCTG AGAAGGGCCT TCGTTACGAC 
CTTACCGTTC CCTTTGCCCG GTATGTGGTG ATGAATCGGA ATTCGCTAAC CCTACCGTTT 
AAACGCTACC AGATGCAGCC CGTCTGGCGG GCCGACCGGC CACAAAAGGG ACGCTACCGC 
GAGTTCTATC AGTGCGATGC CGATGTAGTG GGTACCGATT CGCTCCTGTG CGAAGCCGAA 
ATCGTGCTGA TGATTCATGA GGTATTCAGG AATCTGAACA TTCAGGATTT TACCCTTAAA 
ATTAACAACC GCAAGATTCT GGCTGGTATC GCGGAAGTTA TCGGCGCGCC CGGTCAGGAG 
GGTACTCTGA GCGTGGCGAT TGATAAACTG GACAAAATTG GGAAAGAGAA AGTGCTGAAC 
GAACTCCGTG AGCGGGGATT TTCGGACGAG ACAACAGCTC GCATGGAGCC CTTATTTCTC 
TTTGGCTCTT CTGACCCCAA TCAGACACTT GACCAGTTAA AGAGCTGGCT CTCCGCTTCG 
GACACTGCTC GCCAGGGAAT TGCTGAACTG GAAGAAACGC TTCAACTGGT TAATCAATAT 
GGACTGTCGG ATTCTACTGT AGAAATTGAC CCGACCCTCG CGCGTGGACT TTCCTACTAT 
ACCGGTGCCA TTTTTGAGGT GAAAGCCAAT GGCGTTTCTA TCGGCAGCGT GAGCGGGGGC 
GGTCGGTATG ATAATTTAAC CGGTGCGTTT GGTATGCCGG GTTTGTCGGG TGTGGGGATT 
TCTTTCGGTG TAGACCGGAT TTACGATGTG ATGGAGGAAC TGAACCTCTT TCCCGCCGAT 
GCCGGGCAGG GCACCCAGGT TCTGATTATA CCTTTCGATG CTGAAGCCCG TTCGGTAGCG 
TTGCCTGTGT TGCGGCAACT CCGGACAGCC GCCATTGCCG CCGAGATGTA TCCTGATTTA 
TCGAAAGTTA AGAAGATGCT CGATTATGCC AATGCGAAAA ATATTCCGTT TGTTGTGCTG 
ATTGGTTCCG AAGAGGTGCA AACAGGAGTT CTATCGCTAA AAAACATGCT GACGGGCGAG 
CAGCTTAAAG TAACCACAGA TGAGTTAATA CAGCGGTTAG GCTAA

Protein sequence

MQKPTLPKGT RDFGPEQMRK RLFIFDTIRQ TFQRFGFQPI ETPSLENLST LTGKYGEEGD 
QLLFKILNSG DFAAGITELD LASGSKKLTP KIAEKGLRYD LTVPFARYVV MNRNSLTLPF 
KRYQMQPVWR ADRPQKGRYR EFYQCDADVV GTDSLLCEAE IVLMIHEVFR NLNIQDFTLK 
INNRKILAGI AEVIGAPGQE GTLSVAIDKL DKIGKEKVLN ELRERGFSDE TTARMEPLFL 
FGSSDPNQTL DQLKSWLSAS DTARQGIAEL EETLQLVNQY GLSDSTVEID PTLARGLSYY 
TGAIFEVKAN GVSIGSVSGG GRYDNLTGAF GMPGLSGVGI SFGVDRIYDV MEELNLFPAD 
AGQGTQVLII PFDAEARSVA LPVLRQLRTA AIAAEMYPDL SKVKKMLDYA NAKNIPFVVL 
IGSEEVQTGV LSLKNMLTGE QLKVTTDELI QRLG