Gene Sare_3810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3810
Symbol
ID	5705305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4343765
End bp	4345144
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	66%
IMG OID	641273232
Product	glycyl-tRNA synthetase
Protein accession	YP_001538594
Protein GI	159039341
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0423] Glycyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00389] glycyl-tRNA synthetase, dimeric type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0220595
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCAG ACCGTATCGA CGCCGTTGTC AGCCTCGCCA AGCGTCGGGG TTTCGTCTTT 
CCGTCCAGCG AGATCTACGG GGGGACCCGG TCGGCGTGGG ACTACGGCCC GCTCGGTGTG 
GAGCTGAAGG AAAACGTCCG CCGGCAGTGG TGGCGGAGCA TGGTTCAGCA ACGCGACGAC 
GTGGTGGGCC TCGACTCCGC GGTGATCCTG GCCCGGGACG TCTGGGCTGC CTCCGGCCAC 
CTGGACGCGT TCGTCGACCC GTTGACCGAG TGTCAGTCCT GCCACAAGCG GTTCCGGGCC 
GACCACCTGG AGGAGACCTA CGAGGCCAAG CACGGTCGCC CGCCGGCCTC GTTGAGCGAG 
CTGAACTGCC CGAACTGCGG TAACAAGGGC ACCTTCACCG AACCGCGGAT GTTCAACGGC 
CTGATGAAGA CCTACCTGGG CCCGGTGGAG AGCGACGAGG GTCTGCACTA TCTGCGACCG 
GAGACCGCAC AGGGCATCTT CGTCAACTAC AAGAACGTCG AGACGGTGGC CCGCAAGAAG 
CCGCCGTTCG GCATCGCCCA GACCGGCAAG TCCTTCCGTA ACGAGATCAC CCCCGGCAAC 
TTCATCTTCC GGACCCGTGA GTTCGAGCAG ATGGAGATGG AGTTCTTCGT CGAACCGGGC 
ACCGACGAGG GCTGGCACGA GTACTGGCTC ACCGAGCGTT GGAACTGGTA CCTCGACCTC 
GGTCTCACCG AACGCAACCT GCGCCGGTAC GAGCACCCGC AGGAGAAGCT CTCGCACTAC 
TCGAAGCGCA CCGTCGACAT CGAGTACCGG TTCCAGTTCG GCGGCACCGA GTTCGCTGAG 
CTGGAGGGCA TCGCCAACCG CACCGACTTC GACCTGTCTA CGCACAGCAA GCACTCCGGA 
GTGGATCTGT CCTACTTTGA CCAGGCCAAG GGCGAGCGGT GGATTCCGTA CGTGATCGAG 
CCGGCGGCCG GTCTCACCCG CGCGGTGCTG GCGTTCCTGC TCGAGGCGTA TGACGAGGAC 
GAGGCACCGA ACACCAAGGG CGGCGTGGAC AAGCGCACGG TGATGCGCTT CGACCCGCGG 
CTTGCCCCGG TGAAGGCGGC GGTGCTGCCG CTGTCGCGCA ACGAGGCACT GTCGCCGAAG 
GCCCGGCAAC TCGCGGCAGA CCTGCGTCAG CGCTGGGTGG TGGAGTTCGA CGACTCGCAG 
GCCATCGGCC GCCGCTATCG CCGGCAGGAC GAGATCGGTA CCCCGTTCTG TGTGACGGTC 
GACTTCGACA CCCTCGACGA CAACGCGGTG ACCGTGCGGA ACCGGGACAC CATGGCTCAG 
GAGCGGATCT CCCTGGACCA GGTCGAGCGG TACCTCATCG AACGCCTTCC CGGCTGCTAG

Protein sequence

MPADRIDAVV SLAKRRGFVF PSSEIYGGTR SAWDYGPLGV ELKENVRRQW WRSMVQQRDD 
VVGLDSAVIL ARDVWAASGH LDAFVDPLTE CQSCHKRFRA DHLEETYEAK HGRPPASLSE 
LNCPNCGNKG TFTEPRMFNG LMKTYLGPVE SDEGLHYLRP ETAQGIFVNY KNVETVARKK 
PPFGIAQTGK SFRNEITPGN FIFRTREFEQ MEMEFFVEPG TDEGWHEYWL TERWNWYLDL 
GLTERNLRRY EHPQEKLSHY SKRTVDIEYR FQFGGTEFAE LEGIANRTDF DLSTHSKHSG 
VDLSYFDQAK GERWIPYVIE PAAGLTRAVL AFLLEAYDED EAPNTKGGVD KRTVMRFDPR 
LAPVKAAVLP LSRNEALSPK ARQLAADLRQ RWVVEFDDSQ AIGRRYRRQD EIGTPFCVTV 
DFDTLDDNAV TVRNRDTMAQ ERISLDQVER YLIERLPGC