Gene Sare_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0140
Symbol
ID	5706688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	151822
End bp	153072
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	73%
IMG OID	641269666
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001535066
Protein GI	159035813
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000376127
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCGGGTTC TACTTGTTGG TGCTGGTGGG CGGGAACACG CGCTCGCGCT CGGGTTGGTG 
GCCGATCCCT CGGTCGAGGT GCTGTTCGCC GCGCCGGGAA ATCCGGGGAT CGGAACGGTC 
GCCGTACTGC GTGACGTGGT TCCCACCGAT CCGACCGAGG TGGCGGCGCT GGCGGTCGAG 
TGCGGCGCGG ACCTGGTGGT CGTGGGGCCG GAGGCGCCGC TGGTCGCCGG GGTCGCCGAC 
GCTGTCCGAG CCAAGGGCAT TCCCGCCTTC GGGCCGTCCG CCGAGGCCGC GCGCCTGGAG 
GGTTCGAAGG CGTTCGCCAA GGACGTGATG GCCGCCGCGG GGGTGCCGAC CGCCCGCGCG 
TACACCTGCT CCGATGCCGA GAGCGTCGGC AGGGCTTTGG ACGACTTCGG CGCACCGTAC 
GTGGTCAAGG ATGACTGCCT CGCCGCCGGT AAGGGTGTCG TGGTCACCGA GGACCGCGCG 
GTGGCCGAGC AGCATGCGCA GGGGTGCGGC CAGGTTGTGA TCGAGGAGTA CCTCGCCGGC 
CCCGAGGTCT CCCTGTTCGT CGTGACCGAC GGCGAGGCGG CCGTCCCGCT GCTGCCCGCT 
CAGGACTTCA AGCGCGTCGG CGATGGTGAC AGCGGTCCGA ACACCGGCGG GATGGGGGCG 
TACGCACCGT TGCCGTGGGC GCCGCCCGGC CTGGTCGACG AGGTGATGCG TGACATCGTC 
CACCCGACTC TGGCCGAACT GCGCCGGCGT GGCACACCGT TCGCCGGGCT GCTCTATGTG 
GGCCTGGCCA TCACCGCACG TGGCCCACGG GTGATCGAGT TCAACGCGCG TTTCGGTGAT 
CCGGAAACGC AGGTTGTCCT GGCCCTGTTG GAGACGCCGC TCGCCGGGCT GCTGCACGCC 
GCGGCCACCG GCGAGTTGGC CGCGCACCCG CCGCTGCGCT GGCGGGACGG CGCGGCGGTC 
ACCGTCGTGG TGGCCGCCCA GGGCTATCCG GCCAAGCCGC GTACCGGCGA CGTGATCCTG 
GGGGCGGAGC GTCCGGGCGT CGTCCAGGCG GGCACCGTGC GCCGGGCCGC CGACGGCGCG 
TTGCTCTCCG CGGGCGGCCG GGTCCTGTGC GGCACGGCCA CCGGCGCCGA CCTGGCCGCC 
GCGCGCGACG CCGCCTACAC GCTGGTCCGC GGGATCGAGC TGGCCGACTC GCACCATCGC 
AGCGACATCG CCGCCGCGGC GGTGGACGGT CGTATCGACA TCCCGCGCTG A

Protein sequence

MRVLLVGAGG REHALALGLV ADPSVEVLFA APGNPGIGTV AVLRDVVPTD PTEVAALAVE 
CGADLVVVGP EAPLVAGVAD AVRAKGIPAF GPSAEAARLE GSKAFAKDVM AAAGVPTARA 
YTCSDAESVG RALDDFGAPY VVKDDCLAAG KGVVVTEDRA VAEQHAQGCG QVVIEEYLAG 
PEVSLFVVTD GEAAVPLLPA QDFKRVGDGD SGPNTGGMGA YAPLPWAPPG LVDEVMRDIV 
HPTLAELRRR GTPFAGLLYV GLAITARGPR VIEFNARFGD PETQVVLALL ETPLAGLLHA 
AATGELAAHP PLRWRDGAAV TVVVAAQGYP AKPRTGDVIL GAERPGVVQA GTVRRAADGA 
LLSAGGRVLC GTATGADLAA ARDAAYTLVR GIELADSHHR SDIAAAAVDG RIDIPR