Gene GM21_3748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3748
Symbol
ID	8139122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4317755
End bp	4319131
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	62%
IMG OID	644871367
Product	argininosuccinate lyase
Protein accession	YP_003023525
Protein GI	253702336
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	126
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAG ACAAGCTGTG GGGCGGGCGC TTCACCCAAC CCACCGACAA GTTCGTAGAA 
GAATTCACCG CCTCCATCAA TTTCGACAAG CGCCTGTACC ATCAGGACAT CCGCGGCTCC 
ATCGCCCACG CAACCATGCT GGGCAAGCAG GGGATCATCC CGATAGCCGA CGTCGAGAAC 
ATCGTATCGG GACTGAAGGC TATCCTGGAG CAGATCGAGG CGGGCAAGTT CGACTTCTCG 
GTCTCCTTGG AAGATATCCA CATGAACATC GAGGCGCGGC TCTCCGAGAA GATCGGCGAC 
GCCGGCAAGA GGCTCCACAC CGGCCGCTCC AGAAACGACC AGGTGGCGCT CGACATCAGG 
CTCTACCTGC GGGACGAGCT GGTGGAGGTC TCGGCGTACA TCGACCTCTT GATCGACTCC 
ATCATCCACC AGGCCGAGGA GAACCTCGGC GTCATCATGC CGGGCTTCAC CCACCTGCAG 
ACCGCCCAGC CGATCCTCTT CTCGCACCAC ATGATGGCCT ACCACGAGAT GCTCAAGCGT 
GACAAGGCCC GCATGGAGGA CTGCCTGAAA AGGACCAACG TACTTCCCTT GGGCGCGGGG 
GCGCTGGCCG GGACCACCTT CCCCATCGAC CGGGAGTACG TCGCGGAGCT TCTCGACTTC 
GCCGAGGTCA CCCGCAACTC GCTCGACTCG GTCTCGGACC GCGACTTCGC CATGGAGTTC 
TGCGCCGCCT CGTCGATCCT GATGGTGCAC CTCTCCCGCT TCTCGGAGGA ACTGATCCTC 
TGGTCCACCA GCGAGTTCAA GTTCGTGGAA CTGTCCGACT CTTTCTGCAC CGGCTCCTCC 
ATCATGCCGC AGAAGAAGAA CCCGGACGTC CCGGAACTGG TGCGCGGCAA GACAGGCCGC 
GTGAACGGCA ACCTGGTGGC CCTCTTGACC CTGATGAAAT CGCTTCCGCT TGCCTACAAC 
AAGGACATGC AGGAGGACAA GGAGCCGCTG TTCGACACCA TAGACACCGT GAAAGGGTGC 
CTCAAGGTCT TCGCCGACAT GGTGCGCGAG ATGAAGATCA ACCCGGAGCG GATGGAGGTG 
GCCGCGGCCG CGGGTTTCTC CACCGCGACC GACGTGGCCG ACTACCTGGT GCGCAAGGGA 
ATCCCCTTCC GCGACGCCCA CGAGATCGTG GGGAAGACGG TGCGCTACTG CATCGAGAAC 
GAGATAGACA TCCCCGAGCT TTCGCTTGCC GAGTGGCAGC TCTTCTCAGG GCGCATCGAG 
GAGGACATCT TCGAATCGAT CACCCTGGAG GCCTCGGTCA ACGCCCGTCG CGCGACCGGC 
GGGACCGCGC TGGAACGGGT GCGCGCCGAG ATCGCCCGGG CCAAGGAAGG TAGGTAA

Protein sequence

MSKDKLWGGR FTQPTDKFVE EFTASINFDK RLYHQDIRGS IAHATMLGKQ GIIPIADVEN 
IVSGLKAILE QIEAGKFDFS VSLEDIHMNI EARLSEKIGD AGKRLHTGRS RNDQVALDIR 
LYLRDELVEV SAYIDLLIDS IIHQAEENLG VIMPGFTHLQ TAQPILFSHH MMAYHEMLKR 
DKARMEDCLK RTNVLPLGAG ALAGTTFPID REYVAELLDF AEVTRNSLDS VSDRDFAMEF 
CAASSILMVH LSRFSEELIL WSTSEFKFVE LSDSFCTGSS IMPQKKNPDV PELVRGKTGR 
VNGNLVALLT LMKSLPLAYN KDMQEDKEPL FDTIDTVKGC LKVFADMVRE MKINPERMEV 
AAAAGFSTAT DVADYLVRKG IPFRDAHEIV GKTVRYCIEN EIDIPELSLA EWQLFSGRIE 
EDIFESITLE ASVNARRATG GTALERVRAE IARAKEGR