Gene TM1040_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1946
Symbol
ID	4076897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2050013
End bp	2051275
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	63%
IMG OID	638007262
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_613941
Protein GI	99081787
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0479651
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATCC TCATCCTCGG CAGCGGCGGG CGGGAACATG CACTTGCCTG GGCGGTGATG 
CAGAACCCCA AATGCGACCG GCTCATTGTG GCGCCGGGCA ATGCGGGTAT CGCCCAGATC 
GCCGACTGCG CCAGCCTCAA CGCCGAGGAT GGCGGCGCGG TTGTGACATT CGCCGAGGAA 
AACGCCATTG ATTTTGTGAT CGTCGGCCCC GAGGCGCCTT TGGCCGCCGG TGTGGCAGAC 
CGGTTGCGCG ATGCGGGCAT TCTGGTCTTT GGTCCCTCTG AGGCCGCCGC CCGGCTGGAG 
GCTTCCAAAA GCTTCACCAA GGAGATCTGC GACGCGGCCA ATGCGCCCAC TGCGGGCTAT 
GGCCACTTCA CTGATGCCGA GGCGGCCAAG GCCCATGTCC GTGCCAACGG CGCGCCGATT 
GTGGTCAAGG CCGATGGTCT GGCCGCAGGC AAGGGCGTGA TCGTGGCGAT GGACGAGCAG 
ACTGCGCTCG ATGCCATCGA CGATATGTTC GGCGGTGCCT TTGGTGGGGC GGGCGCAGAG 
GTTGTCATCG AGGAATTCAT GGAAGGTGAA GAGGCATCGC TCTTTGTGCT CTGTGATGGT 
GAGGAAATCC TGTCCATCGG TACCGCACAG GACCACAAGC GCGTCGGCGA AGGCGACACT 
GGCCTAAATA CCGGCGGCAT GGGGGCTTAT TCTCCTGCAC CGGTTCTGAG CGCCGAGGTT 
GAAGCCAAGG CCATGGAAGA GATCGTGAAG CCCACCATGC GGGTGATGGC CGAGCGTGGC 
ATGCCCTACC AAGGCGTGCT CTATGCAGGC CTGATGATCA AGGACGGCCA GCCGCGTCTG 
GTGGAATATA ACGTCCGCTT TGGCGATCCC GAATGTCAGG TGCTGATGAT GCGCCTTGGC 
GCGCAGGCCC TGGACCTGAT GCAAGCCGCA GCCGAAGGTC GCCTTGCGGA CGCCCGCGTC 
AACTGGGCTG ATGACCACGC GATCACGGTG GTGATGGCTG CGGCAGGCTA TCCGGGAAGC 
TATGAAAAAG GCAGCGAGAT CAAGGGCCTT GATGCTCTGC CCGAAGACAG CATGAATATG 
GTCTTTCACG CAGGGACCAA GGCCGATGGC GACAAGATCC TCGCCAATGG TGGCCGGGTG 
CTGAATGTGA CTGCACGGGG CGAGAGCCTC TCTGAGGCGC GCGATCGCGC CTATGCCATG 
GTCGATCAGA TCGACTGGCC CGAGGGCTTC GTGCGCCGCG ACATCGGCTG GCGCGCGCTT 
TGA

Protein sequence

MNILILGSGG REHALAWAVM QNPKCDRLIV APGNAGIAQI ADCASLNAED GGAVVTFAEE 
NAIDFVIVGP EAPLAAGVAD RLRDAGILVF GPSEAAARLE ASKSFTKEIC DAANAPTAGY 
GHFTDAEAAK AHVRANGAPI VVKADGLAAG KGVIVAMDEQ TALDAIDDMF GGAFGGAGAE 
VVIEEFMEGE EASLFVLCDG EEILSIGTAQ DHKRVGEGDT GLNTGGMGAY SPAPVLSAEV 
EAKAMEEIVK PTMRVMAERG MPYQGVLYAG LMIKDGQPRL VEYNVRFGDP ECQVLMMRLG 
AQALDLMQAA AEGRLADARV NWADDHAITV VMAAAGYPGS YEKGSEIKGL DALPEDSMNM 
VFHAGTKADG DKILANGGRV LNVTARGESL SEARDRAYAM VDQIDWPEGF VRRDIGWRAL