Gene Csal_1708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1708
Symbol
ID	4028816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1940710
End bp	1941879
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	67%
IMG OID	637966896
Product	peptidase M20D, amidohydrolase
Protein accession	YP_573759
Protein GI	92113831
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.971842
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCG TCACCCCCAC ATTGCTGCGC GAATGGCGCC ACGAGTTTCA TCGCCGGCCG 
GAGACCGCGT TCGAGGAACA TCACACCAGC GCGCGCATCG TCGAGATTCT CGAGGACGCC 
GGTATCGAGA AGGTCACCGG CCTCGGCGGC GGCACCGGTG TCGTCGCCTG GGTGGACGGT 
CGACATGGCG GCGAGCGCGC CATCGGGCTG CGCGCCGATA TCGACGCCCT GGACGTGCTC 
GAAGCCAACG ACGTTCCTCA TGCCTCGACG ACGCCCGGCA AGATGCACGC CTGCGGGCAC 
GACGGCCATA CCACCATGCT GCTGGGCGCG GCCTGTGCCC TCGCCGAGGC GCCCGACTTT 
GCCGGCCGGG TGTACTTCAT CTTCCAGCCG GCGGAAGAAA ACGAAGGCGG CGGACGCGTC 
ATGGTCGAGG AAGGCCTGTT CACGCGTTTC CCGATGGAAG CCGTCTACGG CGTGCACAAC 
TGGCCGGGCC TGGCGGTCGG CGAAGCCGCC GTCCATGACA CGGCGGTCAT GGCGGCCTTC 
GATGTCTTCC GCGTGAAGCT CACGGGGCAC GGCTGTCATG CCGCCATGCC ACACCTGGGC 
AAGGATGTGG TACTGGCGGC CTGCCAACTG GTCAATCAGC TGCAGGGCAT CGTCAGCCGG 
GAAACCCCGG CGCACCAGAC CGCCGTGATG AGCGTGACCC AGTTCCATGC CGGGGATGCC 
TACAACGTCA TGCCCGAAAC CGTGGAGCTG TGCGGCACCG TGCGCTGTTT CGACCCCGAG 
CTGCGCGACC ACCTCGAAAC GCGTTTTCGG CAGGCGATCG CGGCCATGGC CACCTTCCAT 
GGCCTGGAGG CCGACATCGA CTACCAATCG CGCTACCCGG CCACCTTCAA CACCCCCGCG 
CACGCCGCGC GCTGTGCGGA GGTGCTGGAG ACGCTGCCGG ACATTCACCG GGTGCATCGC 
GACCTGCCGC CCTCCATGGC ATCGGAGGAC TTCGCCTTCA TGCTCCAGCA GCGCCCCGGC 
GCCTATATCT GGCTGGGCAA CGGCGAGGAC AGCGCGTCGC TGCACAACCC GCATTACGAC 
TTCAACGATG CCCTGGCGCC CATCGGGGTG GCGTATTGGG CGGCGCTGGC GAGAACACTA 
CTCGACAACG GTGAACGAGA CGCGCCCTGA

Protein sequence

MTTVTPTLLR EWRHEFHRRP ETAFEEHHTS ARIVEILEDA GIEKVTGLGG GTGVVAWVDG 
RHGGERAIGL RADIDALDVL EANDVPHAST TPGKMHACGH DGHTTMLLGA ACALAEAPDF 
AGRVYFIFQP AEENEGGGRV MVEEGLFTRF PMEAVYGVHN WPGLAVGEAA VHDTAVMAAF 
DVFRVKLTGH GCHAAMPHLG KDVVLAACQL VNQLQGIVSR ETPAHQTAVM SVTQFHAGDA 
YNVMPETVEL CGTVRCFDPE LRDHLETRFR QAIAAMATFH GLEADIDYQS RYPATFNTPA 
HAARCAEVLE TLPDIHRVHR DLPPSMASED FAFMLQQRPG AYIWLGNGED SASLHNPHYD 
FNDALAPIGV AYWAALARTL LDNGERDAP