Gene Dred_1336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_1336
Symbol
ID	4957300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	-
Start bp	1432544
End bp	1433554
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	45%
IMG OID	640180515
Product	L-asparaginase II
Protein accession	YP_001112695
Protein GI	134299199
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4448] L-asparaginase II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.156479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCAGAAC TACTTGTCAA CCTCGTTCGG GGTAGTCTTA TTGAATCCCA ACACCGTGGG 
GATCTGGTTG TTGCCGATCG AGAGGGTGCT ATTTTACTTA GTTTGGGTAA TCCTGAACAC 
CTTGCCTATT GGCGCTCGTC AGCAAAACCC TTTCAAGCTC TGCCTTTAAT CGAACATCAT 
TGTCAAGATA TTTTTAACTT TACTGAACAA GAAATAGCTC TTTTTACTTC ATCCCACGGC 
GGAGAAGAAA ACCATGTGGA GGCAATTCGT GGAATCCTAC ATAAATTAGG GTTATCAGAT 
TCAGCTCTGG ATTGTGGAGT CTCTGCCCCT ATGCACAGGC CCAGTGCAAA AAACATTCTT 
GCATCAGGTA ATAATTTTAG TACCTTAAAT AATGCCTGTT CCGGCAAACA TACCGGTATG 
CTGGCCCTAG CACTGCTCTT AAATGCCCCT TTAACCGGCT ATATACAAAA GGACCATCCC 
GTTCAGCAGG AAATGCTAAA GGCCATTTGC CAATGTACAT CCTTATCCCC GGATAGGGTT 
CATATGGGTG TTGATGGCTG TGGGGTCCCG GTTTTTGGAT TACCCTTAGG CAACATGGCT 
ATGGCCTATG CCCGCTTATC CCTGCCCGAA GGATATTTCT CAGCGGAAAG GGTGCAAGCC 
TTGCATACCA TTCGTAATGC CATGACCGAG TATCCCTATT ATGTGGCAGG CACTGACCGC 
CTAGATAGTA TTCTGATGGA AGTAACTCAG GGTAGAATAG TTGCCAAGAT AGGTTCCGAA 
GGAATTTACT GTGCAGGAAT TGTAGATCAT GGCATCGGGC TGGCTTTAAA AATTGAAGAT 
GGTAGTTCCC GGGCCATCGA CCCCGTGATC ATTGAGGTTT TAAAACACCT GGGGTATATC 
TCACAAGCTG AATTTGAGAA ACTGCGTCAT CTCTGGCGCC CCATACTAAA AAATCACCGT 
GGTGATGAGA TTGGTCATTT AGAAGTTGCC TTTAATTTCA AAAATAAATA G

Protein sequence

MSELLVNLVR GSLIESQHRG DLVVADREGA ILLSLGNPEH LAYWRSSAKP FQALPLIEHH 
CQDIFNFTEQ EIALFTSSHG GEENHVEAIR GILHKLGLSD SALDCGVSAP MHRPSAKNIL 
ASGNNFSTLN NACSGKHTGM LALALLLNAP LTGYIQKDHP VQQEMLKAIC QCTSLSPDRV 
HMGVDGCGVP VFGLPLGNMA MAYARLSLPE GYFSAERVQA LHTIRNAMTE YPYYVAGTDR 
LDSILMEVTQ GRIVAKIGSE GIYCAGIVDH GIGLALKIED GSSRAIDPVI IEVLKHLGYI 
SQAEFEKLRH LWRPILKNHR GDEIGHLEVA FNFKNK