Gene Dgeo_2730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2730
Symbol
ID	4073961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	296721
End bp	298220
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	69%
IMG OID	641228746
Product	histidine ammonia-lyase
Protein accession	YP_594237
Protein GI	94972197
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCCTAG ACCGGCAATT GACGCTTGAC GACTTTATCC GCGTGGTGCG TGGCGGCGAG 
GAGGTGACCC TTGCTGATGC GGCGCGGACA CGGATGGGAC GAGCGCGGGC GGTGATCGAG 
CGCATCGTCG ATGGCCCCGA AGCCGTGTAC GGCGTGAACA CGGGCTTTGG CAAGTTCGCC 
TCGGTCCGCG TGGCGCGCGA GGAGCTGAAG CAGCTCCAGC ACAACCTGAT TGTGTCGCAT 
GCAATCGGGG TAGGTGCAGG TTTGCCTGCC GAAGTCGTGC GCGGAATGCT GCTGCTGCGG 
GCCCAGTCGC TCGCTCTTGG GCATTCGGGG GTGCGGCCGG AGGTGGTCGA ACTCCTGCTC 
GCGCTGCTCA ACGCGGGAGC CTGCCCGGTC GTGCCTGCCC AAGGCAGCGT GGGGGCGAGC 
GGCGACCTGG CCCCGCTCGC GCACCTCGCG TTGGCCCTGA TCGGAGGGGG CGAATTGGAA 
TACGGCGGTC AGGTGCGGCC CGCTGCCGAC GTGCTGGCCG AACTGGGTCT CCAGCCGCTC 
ACGCTGGAGG CAAAGGAGGG GCTGGCCCTC ATCAACGGCA CACAGCTGAT GGGCAGCCTG 
CTGGCCCTCG CGCTGCACGA CGCCCGGACA CTGCTGCACA CGGCGAACCT GGCCGCTGCA 
ATGACGGTGG AGGCGCTGTC CGGCAGTCAC CGGCCTTTCA GTGAGGGCGT GGTGAGCTTA 
CGGCCCCACC CCGGCGCGCT GGAGGTCGCC GCCGACCTGC GCGCCTTCCT GCACGGTTCG 
GACATCGCAC CGGCCCACGC CCACTGCGGC AAGGTGCAGG ATGCCTACAG TCTGCGGGCG 
GTGCCCCAGG TCCACGGCGC TTCCCTCGAC GCACTAATGC AAGCGGGGCG CGTGCTGGAG 
GTGGAATTTG CCAGCGTGAC CGACAATCCG CTGATCTTCC CCGAGACGGG CGAGGTGATC 
TCGGGCGGCA ATTTCCACGG GCAGCCCCTT GCCCTGGCGG CCGATGCCCT GAAGGTGGCG 
GTGGCCGAAC TGGCGAACAT CAGCGAACGC CGCAGCGAGC AACTGCTGAA TCCGGCCCTG 
TCGGGGCTAC CGGGGTTCCT GACGCCGGAA GGGGGCTTAA GCAGCGGCTT CATGATCGCG 
CAGTACACCG CCGCCGCCCT GGTCAGCGAG AACAAGGTGC TGGCCCACCC CGCCAGCGTG 
GACTCGATTC CGACGAGCGC CAATCAGGAA GACCATGTCA GCATGGGCGC GCATGGAGCA 
CGGCAGCTGC GGCAGATCCT GGAAAACGCG CAGAGCGTCA TCAGCATCGA GCTGCTGTGC 
GCCGCGCAGG CCCTGGACTT CCAGTCGCTG CGCGCTGGGC GAGGCGTGCA GGCCGCCTAC 
GAGCGCATCC GGCAGGAGGT CGCACCGCTC GGCCAGGACC GCTACTACCG GCCCGACCTC 
CTGCGGGTGC GCGAGCTGGT GACCAGCGGC GAGCTGCTGC GGGCCGCCCG GGAGGCTTGA

Protein sequence

MILDRQLTLD DFIRVVRGGE EVTLADAART RMGRARAVIE RIVDGPEAVY GVNTGFGKFA 
SVRVAREELK QLQHNLIVSH AIGVGAGLPA EVVRGMLLLR AQSLALGHSG VRPEVVELLL 
ALLNAGACPV VPAQGSVGAS GDLAPLAHLA LALIGGGELE YGGQVRPAAD VLAELGLQPL 
TLEAKEGLAL INGTQLMGSL LALALHDART LLHTANLAAA MTVEALSGSH RPFSEGVVSL 
RPHPGALEVA ADLRAFLHGS DIAPAHAHCG KVQDAYSLRA VPQVHGASLD ALMQAGRVLE 
VEFASVTDNP LIFPETGEVI SGGNFHGQPL ALAADALKVA VAELANISER RSEQLLNPAL 
SGLPGFLTPE GGLSSGFMIA QYTAAALVSE NKVLAHPASV DSIPTSANQE DHVSMGAHGA 
RQLRQILENA QSVISIELLC AAQALDFQSL RAGRGVQAAY ERIRQEVAPL GQDRYYRPDL 
LRVRELVTSG ELLRAAREA