Gene Spro_3524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3524
Symbol
ID	5605215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	3897830
End bp	3898909
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	58%
IMG OID	640939077
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_001479750
Protein GI	157371761
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00772577
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAGTT TTCAAACCGC AAACCGTCGT GGGGATCGCG CAGTGACCGA CAAAACCTCT 
CTCAGCTATA AAGACGCAGG TGTCGATATC GATGCTGGCA ATGCATTGGT AGACCGCATC 
AAAGGTGTAG TTAAACAGAC CCGCCGCCCT GAAGTGATGG GTGGTCTGGG CGGTTTTGGC 
GCCCTGTGTG CGTTGCCGCA GAAATACCGC GAGCCGATAC TGGTTTCCGG TACCGACGGC 
GTAGGCACCA AGCTGCGTCT GGCGATGGAC CTGAAACGAC ACGACACCAT CGGCATCGAT 
CTGGTTGCAA TGTGTGTGAA CGATTTGGTG GTACAGGGCG CTGAGCCGCT GTTCTTCCTG 
GATTACTTCG CGACCGGCAA GCTGGACGTG GACACCGCGG CCAGCGTGAT CACCGGTATC 
GCCGAGGGCT GCAAGCAGTC CGGTTGTGCG CTGGTGGGCG GTGAAACCGC CGAAATGCCA 
GGTATGTATC ATGGCGAAGA TTACGACGTG GCCGGCTTTT GCGTCGGCGT GGTCGAGAAA 
TCCGAAATCA TCGACGGCAG CAAGGTGCAG TCAGGCGATG CCCTGATCGC CCTCGGCGCT 
TCCGGCCCGC ACTCCAACGG CTACTCGCTG GTGCGCAAAA TTCTGGAAGT CAGCAACACC 
GACCCAACCA CTACCGATCT GGACGGCCAA CCACTGGCTG ACCATCTGCT GGCACCAACC 
AAAATTTATG TGAAATCCGT GCTGGAGCTG ATCGAGAAAA TCGACGTGCA CGCTATCGCT 
CACCTGACCG GCGGCGGCTT CTGGGAAAAC ATCCCACGCG TACTGCCGGA AGGCATGCAG 
GCGGTGATCG ACGAATCCAG CTGGCAGTGG CCGGCCGTCT TCAACTGGCT GCAGCAAACC 
GGTAACGTCA GCCGTCACGA AATGTACCGC ACCTTTAACT GTGGCGTGGG CATGGTGATC 
GCTCTGCCGG AAGAATCGGT TGAATCCGCC ATCGCATTGT TGACCGCAGC CGGTGAAAAA 
GCGTGGAAGA TCGGTAAACT GACCGCCTCT TCTGACGAAC AACAAGTGGT CATCAACTGA

Protein sequence

MHSFQTANRR GDRAVTDKTS LSYKDAGVDI DAGNALVDRI KGVVKQTRRP EVMGGLGGFG 
ALCALPQKYR EPILVSGTDG VGTKLRLAMD LKRHDTIGID LVAMCVNDLV VQGAEPLFFL 
DYFATGKLDV DTAASVITGI AEGCKQSGCA LVGGETAEMP GMYHGEDYDV AGFCVGVVEK 
SEIIDGSKVQ SGDALIALGA SGPHSNGYSL VRKILEVSNT DPTTTDLDGQ PLADHLLAPT 
KIYVKSVLEL IEKIDVHAIA HLTGGGFWEN IPRVLPEGMQ AVIDESSWQW PAVFNWLQQT 
GNVSRHEMYR TFNCGVGMVI ALPEESVESA IALLTAAGEK AWKIGKLTAS SDEQQVVIN