Gene Sare_1145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1145
Symbol
ID	5704289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1294410
End bp	1295468
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	67%
IMG OID	641270660
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001536044
Protein GI	159036791
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000761726
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGCTC AGCGGATGCT CACCGGTGAC CGTCCCACCG GGAAACTGCA CCTCGGCCAC 
TACGTCGGCA GCATCGCCAA CCGGGTGAAG TTGCACCAGC GGTACGAGAG CTTCTTCATC 
ATCGCCGACC TGCACATGTT GACCACCAAG AACACCCGCG ACGACATCGC GAGGGCCACC 
CAGAACGCCC GGGACATGGT CCTCGACTCC CTCGCCGCGG GGATAGACCC GGACACCGCC 
ACCTTCTATC TCCAGTCGGC GATCCAGGAA GTCGGCGATC TCAACACCCT CTTCCAGAAC 
CTGGTCACCG TGCCGCGCCT GGAGCGGGTG CCATCGCTCA AGGACATGGC CCGCGACGCT 
GGTAAGGACG AGATGCCATA CGGTCTGCTC GGCTACCCGG TCCTGCAGGC CGCCGACATC 
CTCTGCGTCA AGGCCCACGT GGTGCCCGTC GGCAAGGACA ACGCCGCGCA CGTCGAGGTC 
ACCAGGGAAC TGGCCCGCCG CTTCAACCAC CTCTACGGCG AGGTCTTCCC CGTCCCTGAA 
CTTGTCAGCG CCGAAACGCC CACCCTGGTC GGCACCGACG GCCGGGCCAA GATGAGCAAG 
AGCCTGGGCA ACGTCATCGC GCTTTCCGAC GAGCCGGCCG ACGTTCGCCG CAAGGTCATG 
GGCATGTACA CCGACCCGAA CCGGGTCCGT GCGGACGTGC CCGGCACGGT CGAGGGCAAC 
CCGGTGTTCC AGTATCACGA CGTCTTCAAC CCGAACCGGG CCGAGGTCGC TGACCTCAAG 
AGTCGCTATC GCGAGGGCAG GGTCGGCGAT GTCGAGGTCA AGGAGAAGCT GGCCACCGCG 
TTGAACGCGT TTCTCGACCC GGTGCGCGAG CGGCGCGCCC GCTACGAGGC CGACCGGGGC 
CTGGTCGACG AGCTGATCGT GGAAGGCACG GAACGCACCC GGCGGGTGGT GCGGCAGACC 
GTGTTCGACG CACGCAAGGC AATGGGCCTC ACCGGCGTCT ACACGCAACT GCGCCGCAAG 
GCGGAACGGT CCCGCAAGCC CGCGGTCACC ACCGCGTAG

Protein sequence

MTAQRMLTGD RPTGKLHLGH YVGSIANRVK LHQRYESFFI IADLHMLTTK NTRDDIARAT 
QNARDMVLDS LAAGIDPDTA TFYLQSAIQE VGDLNTLFQN LVTVPRLERV PSLKDMARDA 
GKDEMPYGLL GYPVLQAADI LCVKAHVVPV GKDNAAHVEV TRELARRFNH LYGEVFPVPE 
LVSAETPTLV GTDGRAKMSK SLGNVIALSD EPADVRRKVM GMYTDPNRVR ADVPGTVEGN 
PVFQYHDVFN PNRAEVADLK SRYREGRVGD VEVKEKLATA LNAFLDPVRE RRARYEADRG 
LVDELIVEGT ERTRRVVRQT VFDARKAMGL TGVYTQLRRK AERSRKPAVT TA