Gene Rcas_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4089
Symbol
ID	5541600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5299895
End bp	5301088
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	62%
IMG OID	640896201
Product	arginine biosynthesis bifunctional protein ArgJ
Protein accession	YP_001434139
Protein GI	156744010
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.245941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTACA ATATTATCGA AGATGGTCAT ATTTCGAGTC CGGCAGGATT TCGTGCCACC 
GGCGTTTCCT GCGGATTGAA GGAGATTCGC GCACGCGATC TGGCAATCGT CTACTCACAA 
TTGCCCTGCC GTGTCGGGGC GCTCTTTACG ACGAACCTGA TCGTGGCTGC GCCGATTTTC 
TTCAATCAGG CGATCCTGGC GCGGAACCGC GATGCCATCC GCGCTGTCGT CATCAATGCC 
GGGCATGCCA ACGCCGGTAC CGGTCAACCG GGACTTGCGA CCGTCGTGGA GTGCGCCAAG 
ATTGCAGCCG ATGAACTCGA AATACCGCGC GATAGCGTGT TGATGCTTTC AACCGGGCAG 
ATCGGCGTTG CACCGCCGCT CGACCGTATG CGAGAAGGAA TCCGGCGTGC AGCGTCTGAA 
CTGGACAGTA ATGGCGGGCG CCGCGCAGCG CTTGCGATCC TGACGAGCGA TACGCGCCCA 
AAAGAACGCG CCTTCCGCGT GTCGCTGCGC GAAGGGCGAA CGGTCACGTT GGCCGGTATG 
GCGAAAGGAA CGCGCATGGT CAGCCCGCAC CTTGCCACGC TGCTCTGCGT GATCACCACC 
GACGCGCCGA TTGAGTCGCG CTTGTTGATG CGTGCGCTCG ACCAGAGTGT CAATCGTTCG 
TTCGGAAGGT TGCACATCGA CGGCGATATG AGCCCAAACG ATGCGGTGCT GGTGCTGGCA 
AACGGCGCGG CTGGAGGCCC GCCGATTATT GATGGATCGC GCGAACTCGG CGTCTGGCAA 
CAGGCGCTCG ATGCGCTGTG CCACGATCTG GCGCAGCAGG TGTTGCGTGA TGCAGCGTCG 
GGTGGGAAGC ATATCCTCAT TACGGTGCGT GGCGCATCCA ACGATGCCGC CGCCTCGCAG 
GTGGCGCGCG CGGTTGCTCG GTCGACAGCC GTGCGCCATA TGTGCGCGCG CAATCTACCC 
GATTGGGGCG GGATGCTCGT CGCCGTCGGC GCAAGCGGCG TGGACCTGCG CCCCGATATG 
CTTGAACTGC GCATCGGCGC CGTCACGGTG ATGGATGATG GAGCGCCGGT GCGTTTCGAT 
CCGACGGCGC TGGTGCAGGC GCTATCCGGT CCGGAAGTCG AGTTGGCGAT CGACCTGCAT 
ACCGGCGCCG GTACGGCAAC CGTATGGACG TGTACGACCG GTATGGAGCC ATAA

Protein sequence

MSYNIIEDGH ISSPAGFRAT GVSCGLKEIR ARDLAIVYSQ LPCRVGALFT TNLIVAAPIF 
FNQAILARNR DAIRAVVINA GHANAGTGQP GLATVVECAK IAADELEIPR DSVLMLSTGQ 
IGVAPPLDRM REGIRRAASE LDSNGGRRAA LAILTSDTRP KERAFRVSLR EGRTVTLAGM 
AKGTRMVSPH LATLLCVITT DAPIESRLLM RALDQSVNRS FGRLHIDGDM SPNDAVLVLA 
NGAAGGPPII DGSRELGVWQ QALDALCHDL AQQVLRDAAS GGKHILITVR GASNDAAASQ 
VARAVARSTA VRHMCARNLP DWGGMLVAVG ASGVDLRPDM LELRIGAVTV MDDGAPVRFD 
PTALVQALSG PEVELAIDLH TGAGTATVWT CTTGMEP