Gene Csal_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2037
Symbol
ID	4025933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2298862
End bp	2299902
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	637967232
Product	asparaginase
Protein accession	YP_574087
Protein GI	92114159
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACTG CCAACACCAT TCTTGTCCTG TATACCGGGG GCACCCTCGG CATGATCGAG 
AGCGCCCACG GCCTGCGCCC CGCCGGCGAC TTCGAAGCAC GCCTGCGCCT GGCGATCTCG 
CGCTTGCCGG CCTCCCGTGG CGATGGCATT CCTCCCTTCG AGATGCTCGA GTACGCAACG 
CCCATCGATT CGAGCAGCGC GACACCCGTC GACTGGCAGC GACTGGCACG GGATATCGCC 
ACACGGCATG CCGACTACGC GGGATTCGTG GTTCTGCATG GCACCGACAC GCTCGCCTGG 
ACCGCCTCGA GTCTGGCCTT CCAGCTGCAG GGCATCGACA AGCCAGTGGT CGTGACCGGC 
GCCCAGAAGC CGCTGGAAGC GCCAGGCAGC GATGCGCTGG GCAACATCGA GACGGCCCTG 
CGCTTCGCGG CACTCCCCGG CCTTGCCGAA GTCACCGTCG CCTTCGCGGG CAAGCTCATG 
CGCGGCTGCC GCAGCCGCAA ATGGGACACC CACGCCTTCG ACGGCTTTGC TTCGCCCAAC 
TGGCCACTGC TGGGAGAATG CATCGACGGC GCTCCGGTCT TGTACCCCTC TCGGCTGTTG 
TCGCCGAGCG GCGCACCCCG CTTCGAACTG CCCGATCTGT CGACGACGTC GTCGGTCGTG 
CGCCTGGCGC TGTGGCCGGG CATCCAGGCC CGTCAGGTCG CGACCCTGCT CGACGAGGAC 
AGCGTGCGGG GGGCCGTGCT CGAATGCTGG GGCAGCGGCA ACATGCCCGA CGACCCGCAC 
CTGGCGGGGG CCCTGGTTAC CGCCAGTGGC GCCGGCAAGC TATTGGCAGT GGTCAGCCAG 
TGCCCGCATG GGCCGGTGGC CCTGGAGACC TATGCCAGCG GCCAGGCACT CGGTGATGCC 
GGCGTGCTGG CCGGCGACGA CATGACCCCC GAGGCAGCCT TCACCAAGCT CACCCATGTC 
CTGGCACAAC CACTGACGGA TGCACAGCGC CGTCATCGCT TCCTCAGCCC ACTGTGCGGC 
GAACGCAGCG CGCTTGCATG A

Protein sequence

MTTANTILVL YTGGTLGMIE SAHGLRPAGD FEARLRLAIS RLPASRGDGI PPFEMLEYAT 
PIDSSSATPV DWQRLARDIA TRHADYAGFV VLHGTDTLAW TASSLAFQLQ GIDKPVVVTG 
AQKPLEAPGS DALGNIETAL RFAALPGLAE VTVAFAGKLM RGCRSRKWDT HAFDGFASPN 
WPLLGECIDG APVLYPSRLL SPSGAPRFEL PDLSTTSSVV RLALWPGIQA RQVATLLDED 
SVRGAVLECW GSGNMPDDPH LAGALVTASG AGKLLAVVSQ CPHGPVALET YASGQALGDA 
GVLAGDDMTP EAAFTKLTHV LAQPLTDAQR RHRFLSPLCG ERSALA