Gene RoseRS_4052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4052
Symbol
ID	5211035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5074074
End bp	5075087
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	63%
IMG OID	640597640
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001278346
Protein GI	148658141
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.098628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGCG TCGGTGTTTT TGGCGCCACC GGGTATGCCG GTTACGAATT GCTGCGATGG 
CTGCGACGCC ATCCAGAAGC GCGCGTGGTG TTCACAGCGT CCGAGTCGTC AGCCGGGGCG 
TCGCTCGCCG ATGTTGTGCC GGGTCCGCTC GACGCGCCAT TGATTGCACC CGATGAAGCG 
CCGCTGGCGG ATGTCGATCT GGTTTTCCTT GCGCTACCGC ATGGCGCTGC CGGGAAGATG 
GCGCGACGCG CACGCGCCGC CGGGGTGCGG GTCATCGATT TCTCCGCCGA CTTTCGCCTG 
ACGACGCCTG AAGCGTACCG GCGCTGGTAT GGGCATGAAC ACCCGGCGCC TGAGTTGCTG 
CCAGCGCCTT ATGGTCTGCC GGAACTCAAT CGCGCCGCTC TGCGCAACGC GCCGCTAATC 
GCCAATCCTG GCTGCTATCC GACCGGTGTG CTGCTCGGTA TCGCGCCGCT GCTGATGATG 
GGCGCGTTGA CCGATCCGCT GATCATCGTC GATGCCAAGT CAGGGGTGTC GGGAGCGGGC 
CGCGCGCCGA AACAGAATAC GCACTTCGTC GAGGTGAACG AAAACCTTGC GCCGTACAAC 
ATCGGTCAGG TTCACCGACA CGTCGGCGAA ATGATGCAGG AAGCACAGCG CATCGCCTGC 
GGCATAACGC CGGAGATTGT CTTCACGCCA CAACTTCTGC CAGTGAGTCG CGGCATTCTG 
AGCACAATCT ACCTGCGCAT ACCGGACGAC TGGAGCGAAG ATCGGGTGCG GGCGCTGTAC 
TGCGAACAGT ACGCTGACGA GCCATTCGTG CGGGTGCTGC CGACGGGCGC GCTGGCAACC 
CTGGCGCACA CGACACATAC CAACGTCTGC GCCATCTCAC TGACCCTGGC GCGACCCGGG 
TTGCTCATCG TGGTCTCCAG CGAGGATAAT ATGGTCAAAG GCGCAGCCGG GCAGGCGATC 
CAGAACATGA ACCTGATGTT CGATCTGGAG GAGACGACCG GGCTGATGGG TTGA

Protein sequence

MIRVGVFGAT GYAGYELLRW LRRHPEARVV FTASESSAGA SLADVVPGPL DAPLIAPDEA 
PLADVDLVFL ALPHGAAGKM ARRARAAGVR VIDFSADFRL TTPEAYRRWY GHEHPAPELL 
PAPYGLPELN RAALRNAPLI ANPGCYPTGV LLGIAPLLMM GALTDPLIIV DAKSGVSGAG 
RAPKQNTHFV EVNENLAPYN IGQVHRHVGE MMQEAQRIAC GITPEIVFTP QLLPVSRGIL 
STIYLRIPDD WSEDRVRALY CEQYADEPFV RVLPTGALAT LAHTTHTNVC AISLTLARPG 
LLIVVSSEDN MVKGAAGQAI QNMNLMFDLE ETTGLMG