Gene Rcas_3362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3362
Symbol
ID	5540861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4391237
End bp	4392247
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	640895480
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001433430
Protein GI	156743301
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0453282
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCG TCGGTATTTT TGGCGCAACC GGTTATGCCG GGTATGAACT GCTCCGCTGG 
CTGCGGCGTC ACCCGGAAGT GCGCGTCGTC TTCGCCGCTT CCGAGTCGTC GGCTGGAGCA 
TCGCTCGCCG ATGTCATTCC CGGTCCGCTC GATACACCAC TGATTGCGCC CGACGAAGCG 
CCGCTCGGCG ATGTCGATCT GGTCTTTCTG GCGTTGCCGC ACGGCGCTGC GGGAAAGATG 
GCGCGGCGCG CACGCGCGGC TGGCGTGCGT GTGATCGATT TCTCCGCCGA TTTTCGACTG 
GCCACGCCCG AATCTTACCG GCGCTGGTAT GGGCACGATC ATCCCGCGCC CGAATTGCTG 
CCGGCGCCCT ACGGTTTGCC GGAACTCAAC CGCGCGGCGC TGCGCGGCGC GATGCTGATC 
GCTAATCCTG GCTGTTATCC GACCGGTATG CTGCTCGGTG TTGCGCCGCT TCTCATGGCC 
GGCGCGTTGA CCGACCCGCT GATCATCGTC GATGCCAAGT CGGGAGTGTC GGGGGCAGGG 
CGCGCGCCGA AGCAGAATAC GCACTTCGTC GAAGTGAACG AGAATCTTGC GCCGTACAGT 
ATCGGGCAGG TTCACCGTCA TGTTGGCGAG ATGCGCCAGG AAGCGCAGCG GATCGCGCGC 
GGCGTGGCGC CGGAGATCGT GTTCACGCCG CAGTTGCTGC CGGTGAGCCG CGGTATCCTG 
AGCACGATCT ACCTGCGCAT ACCGGACGAC TGGAGTGAGG ATCGGGTGCG CGCGCTGTAC 
CGTGAGCAGT ATGCTGACGA ACCATTCGTG CGGGTGCTGT CGGCGGGCGC GCTGGCGACT 
CTGGGGCACA CAACAGACAC GAATGTCTGC GCTATCTCGC TGACCCTGGC GCGACCGGGG 
TTGCTCATCG TTGTCTCCAG TGAAGACAAT ATGGTCAAAG GCGCTGCTGG TCAGGCGATC 
CAGAACATGA ACCTGATGTT TGGGCTGGAT GAGACAACCG GATTGGTGTA G

Protein sequence

MIRVGIFGAT GYAGYELLRW LRRHPEVRVV FAASESSAGA SLADVIPGPL DTPLIAPDEA 
PLGDVDLVFL ALPHGAAGKM ARRARAAGVR VIDFSADFRL ATPESYRRWY GHDHPAPELL 
PAPYGLPELN RAALRGAMLI ANPGCYPTGM LLGVAPLLMA GALTDPLIIV DAKSGVSGAG 
RAPKQNTHFV EVNENLAPYS IGQVHRHVGE MRQEAQRIAR GVAPEIVFTP QLLPVSRGIL 
STIYLRIPDD WSEDRVRALY REQYADEPFV RVLSAGALAT LGHTTDTNVC AISLTLARPG 
LLIVVSSEDN MVKGAAGQAI QNMNLMFGLD ETTGLV