Gene Csal_1581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1581
Symbol
ID	4027600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1799897
End bp	1800964
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	66%
IMG OID	637966770
Product	peptidyl-arginine deiminase
Protein accession	YP_573633
Protein GI	92113705
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCCAC GCCTGTTCCC CGAATGGCAT CCCCAGGACG CCATTCAGCT CACCTGGCCC 
ACCACGGAAA GCGACTGGGA GCCTCTGCTC GAACGCATCG AAGCCACCAT GGAAGCCATC 
GTGGTCGCCA TCACCCGCTT CCAGCCGGTG CTGATCGTCG TCGCCGATGC ACCCACGCGG 
CAACGTCTCG ACACGCGTTT CATGCAACTG GGCATTCACC CGAAGCAGTG GCGACTCATC 
GTCGCCCCCG CCGACGACAC CTGGACCCGC GATCACGGCC CCATCGCCGT GGAGCGGCAA 
TCGGAGGTGG TGCTGCTGGA TTACCGCTTC ACCGGCTGGG GCGGCAAGTT TCCCGCCCAG 
CGTGATGACG CCCTGACCGC GGCCCTGGCG GACATCGGCA TTTATGCCGC GCCCTGCGAA 
CAACGCGACC TGGTGCTGGA AGGCGGTGCC ATCGACAGCG ATGGCGAAGG GACTCTGCTG 
GTCACCGAGG CGTGTCTGCT CAATCCCAAC CGCAACCCGG ACTTGACCCG CGAGGACATC 
GAAGCGCGCT TGCGCGACGA CCTGGGTGTC GAACGCTTCC TGTGGCTCAC GCAGGGCCAC 
CTCGAGGGCG ATGACACCGA CAGCCACATC GATACGCTGG CGCGTTTCTG CGACGCACAC 
ACCATCGCCT ATGTCCGCTG CGAGGATCCG GACGATCCGC ACTACCCGGC CCTCGCCCAG 
ATGGAAAGCG AGCTCAAGGC CATGCGTCGC GCCGACGGCA GCGCCTATCG CCTGATTCCG 
CTGCCCCTGC CGCAGCCGTG TCACGACCCG GACGATGGCC ACCGTCTGCC GGCAACGTAT 
GCCAACTTCC TGATCATCAA CGGCGCGGTG CTGGTGCCCA CCTACGCCGA CGCCGCCGAC 
GGCGTGGCCC TGACGGCACT GGCCAGTGCC TTTCCGGGAC GCAGCATCAT CCCCATCGAC 
TGCCGCACCG TCATTCGCCA ACATGGCAGC CTGCACTGTC TGACCATGCA GCTGCCGCGC 
GGCGCACTCT TCACGCCGTC GAACGGCGAC GTCACTTCGG AGGCCTGA

Protein sequence

MLPRLFPEWH PQDAIQLTWP TTESDWEPLL ERIEATMEAI VVAITRFQPV LIVVADAPTR 
QRLDTRFMQL GIHPKQWRLI VAPADDTWTR DHGPIAVERQ SEVVLLDYRF TGWGGKFPAQ 
RDDALTAALA DIGIYAAPCE QRDLVLEGGA IDSDGEGTLL VTEACLLNPN RNPDLTREDI 
EARLRDDLGV ERFLWLTQGH LEGDDTDSHI DTLARFCDAH TIAYVRCEDP DDPHYPALAQ 
MESELKAMRR ADGSAYRLIP LPLPQPCHDP DDGHRLPATY ANFLIINGAV LVPTYADAAD 
GVALTALASA FPGRSIIPID CRTVIRQHGS LHCLTMQLPR GALFTPSNGD VTSEA