Gene Csal_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1786
Symbol
ID	4028585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2031634
End bp	2032995
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	67%
IMG OID	637966974
Product	guanine deaminase
Protein accession	YP_573837
Protein GI	92113909
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACT CCCGACTCCT GCGCGGTGCC GTGCTGACCT TCGACGACGA TCCCGGCGAG 
TCCCCCGTGC CACGCCCGGA CAGTCTGCGC TACTGGGAGG ACGGCGCCGT CTGGCTGGAG 
AACGGCCATA TCCGCGCCGT CGATGACTAC ACCACGCTGG CACCGCACGT GCCGGCAGGG 
CTCGAGATCG TCGACTACCG TGGCAAATTG ATCATGCCCG GCTTCATCGA CAGCCATGTG 
CATTATTCGC AGCTCGACAT CATCGCCTCG TTCGGACGCG AACTGCTCGA CTGGCTCAAC 
GACTACACCT TTCCCGCCGA ATGTCGCTTC GCCGAACGGG CGCATGCCGA GGAGGTCGCC 
GAGCGATTCC TTGATGAACT CCTGCGCGGC GGCACCACCA CCGCCCAGGT GTTCTGCACC 
TCGCATCCCG GCTCGGTGGA CAGCATCTTC TCCGCGGCCC GAGCCCGCCG ACTGCGAATG 
CTGGCCGGCA AGGTACTGAT GGATCGCCAT GCCCCCGAGG CCCTGATCGA CACCGCCGTC 
GGCGGCATCC GCGACAGCGA ACGGCTGATC GCCGACTGGC ACGGCAAGAA CCGTCTGGCG 
TATTCGCTGA CACCCCGCTT CGCGCCGACA TCCAGCCGCG AGCAACTGGA TGCCGTGGGC 
GGCGTGCTGC GCAACGATGC CAGCCTGTAT CTGCAAAGCC ACCTCTCGGA ACACCGTGGC 
GAACTGGCCT GGGTCGCCGA GCTGTTTCCC GAATGCCGCG ACTATCTCGC CGTCTACGAA 
CGCCATGGCC TGGTCGGTCC GCGCAGCACC TATGCCCACG GCATCCATCT TTCCGACGAC 
GAACGCGCAC GACTCGCCGA GACCGGCGCC AACATCGCCT TTTCACCGAC CTCCAACCTG 
TTTTTGGGCA GCGGGCTCTT CGACCGCATC GCCACACGCG AAGCGGGCGT GGTCACCTCC 
CTGGCCAGCG ACGTGGGCGC TGGCACCGGC CTGTGCGGCT TGACGACCCT GCAAGGCGCC 
TATCAGGTGG GCGCCTTGCT CGGCCAGCCG CTGACGGCAT GGCAAGGGTT CTATCGGCTC 
ACGCTGGGCA ACGCCCGTGC CCTGCATCTG GAACATTGCA TCGGCCGCCT CGAGGCCGGC 
CACGAAGCCG ACCTGGTCGT GCTGGACCTC GCCGCCACCC CCCTCATGGC ACGGCGAACC 
CAGGTCGCCG AAACGCTCGG CGAGCGCCTT TTCGCGCTGA TGATGCTGGG TGACGACCGC 
AGCGTCCACG CCACCTGGGC CAGCGGCCGG CCGGTGCACC AGCGTGATGC AAGCGATACG 
CACGCCGCCC CCTCGAGGCG CATGGCACAT TCCCCCACAT GA

Protein sequence

MTDSRLLRGA VLTFDDDPGE SPVPRPDSLR YWEDGAVWLE NGHIRAVDDY TTLAPHVPAG 
LEIVDYRGKL IMPGFIDSHV HYSQLDIIAS FGRELLDWLN DYTFPAECRF AERAHAEEVA 
ERFLDELLRG GTTTAQVFCT SHPGSVDSIF SAARARRLRM LAGKVLMDRH APEALIDTAV 
GGIRDSERLI ADWHGKNRLA YSLTPRFAPT SSREQLDAVG GVLRNDASLY LQSHLSEHRG 
ELAWVAELFP ECRDYLAVYE RHGLVGPRST YAHGIHLSDD ERARLAETGA NIAFSPTSNL 
FLGSGLFDRI ATREAGVVTS LASDVGAGTG LCGLTTLQGA YQVGALLGQP LTAWQGFYRL 
TLGNARALHL EHCIGRLEAG HEADLVVLDL AATPLMARRT QVAETLGERL FALMMLGDDR 
SVHATWASGR PVHQRDASDT HAAPSRRMAH SPT