Gene Rcas_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1823
Symbol
ID	5539301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2331856
End bp	2332902
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	640893961
Product	agmatine deiminase
Protein accession	YP_001431932
Protein GI	156741803
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAT CCCAACCGAC GCCAGCCCAA CTCGGATACC GGATGCCGGC TGAGTGGGCG 
CCACACCAAG CGACCTGGCT CTCCTGGCCC CACAACGAGG AGTCGTGGCC CGGCAAACTG 
CACATCGTCC TGCCGATCTA TGCGCGCATG GTCGCTGCGC TGGCGCGCTC CGAAACCGTT 
CACATCAACG TCAACGACGA AGCAATGGAA GAAGAAGCGT GTCGATTACT GCACAGCGTC 
GGCGCCGAAG GCGACATTCA CTTTCATCAT TTTCCCACCA ACGATGCCTG GTGCCGTGAC 
CACGGCGCGA TCTTCGTTGT GCGCGATGGC GACGATCCCC TGGCAGCGAT CAGGTGGGAG 
TACAACGCCT GGGGTGGCAA GTACCCGCCC TTCGATCTGG ACCGGCAGAT TCCCCGGCGC 
ATGGCGGAGG CGCTGGGGGC GCCCTGCTTC GATGGCGGCA TGGTGTTGGA AGGCGGCTCG 
ATCGATGTCA ATGGCGAAGG ACTGTTGCTC ACGACCGAGG CTTGCCTGCT CAACCCCAAT 
CGCAATCCGC ATCTCACCCG CGAGCAGATC GAGCAGCGAT TGTGCGATTA TCTGGGTGTC 
TCAACGGTGC TCTGGCTTGG CGATGGGATC GTAGGCGACG ACACCGATGG GCACGTTGAC 
GACCTGACCC GCTTTGTCGC GCCCGACACC GTTGTGACTG CGGTGGAAAG CGATCCGTCG 
GATGAGAATT ACGACGCGCT CCAGGAAAAT CTCCGTCGTC TGCGGCGCAT GACCGATCAC 
CGCGGCGGGG CGCTGCGGAT CGTCGCACTG CCGATGCCAC CTGCAATTGT GTATGAAGGG 
CGGCGCCTGC CCGCTTCCTA CGCGAACTTT TACATTGCCA ATCGTGTTGT GCTGCTCCCC 
ACGTTCAACC ACCCGAACGA CGACCGCGCA GCAGCGATCC TGGCGGAACT TTTTCCGACA 
CGCGAGATTG TGGGGATTGA CTGCACCGAT ATGGTGTGGG GGCTTGGCGC CTGGCACTGC 
CTGACGCAGC AGGTTCCGGC GGTGTAA

Protein sequence

MTTSQPTPAQ LGYRMPAEWA PHQATWLSWP HNEESWPGKL HIVLPIYARM VAALARSETV 
HINVNDEAME EEACRLLHSV GAEGDIHFHH FPTNDAWCRD HGAIFVVRDG DDPLAAIRWE 
YNAWGGKYPP FDLDRQIPRR MAEALGAPCF DGGMVLEGGS IDVNGEGLLL TTEACLLNPN 
RNPHLTREQI EQRLCDYLGV STVLWLGDGI VGDDTDGHVD DLTRFVAPDT VVTAVESDPS 
DENYDALQEN LRRLRRMTDH RGGALRIVAL PMPPAIVYEG RRLPASYANF YIANRVVLLP 
TFNHPNDDRA AAILAELFPT REIVGIDCTD MVWGLGAWHC LTQQVPAV