Gene Spro_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_0804
Symbol
ID	5603740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	898400
End bp	899935
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	62%
IMG OID	640936315
Product	histidine ammonia-lyase
Protein accession	YP_001477038
Protein GI	157369049
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.422259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.987509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGC TGACTATTCG CCCAGGCCAA CTGACACTGG CGCAACTGCG TGAAATTTAT 
CAACACCCGG TCACCCTGAC TCTGGACGAC AACGCCTACG CAGATATCCA GAAAAGCGTT 
GCCTGCGTTG AACGTATCGT TGAGGAAAAC CGTACCACCT ACGGCATTAA CACCGGTTTC 
GGCCTGCTGG CATCCACCCG CATCGCTCGC GAAGATCTGG AAGATCTGCA GCGTTCTATC 
GTGCTGTCGC ATGCCGCCGG CGTCGGTGCG CCCACCGACG ACAATCTGGT GCGCCTGATT 
ATGGTGCTGA AAATCAATAG CCTGTCGCGC GGCTTCTCCG GCATCCGTCT GGAAGTGATC 
GAGGCGCTGA TGGCGCTGGT CAACGCCGAA GTCTATCCGC ATATCCCGCT GAAAGGCTCC 
GTAGGCGCCT CCGGCGACCT GGCACCGCTG GCACACATGA GCCTGGTGCT GTTGGGTGAA 
GGCAAGGCCC GTTATCAGGG CGAATGGCTG CCTGCCACCG AAGCGCTGGC CAAAGCGGGC 
CTGAAACCGC TGACGCTGGC GGCCAAAGAA GGCCTGGCAC TGCTGAACGG CACCCAAGTT 
TCCGCCGCCT TTGCCCTGCG CGGTTTGTTT GACGTGGAAG ACCTGTACGC CGCGGCAACG 
GTCACCGGTA GCCTGACGGT GGAAGCCGCT CTGGGTTCAC GCAGCCCGTT TGATGCGCGC 
ATTCATGCCG TGCGCGGTCA GCGTGGTCAG ATTGACGCCG CCGCCGCTTA CCGCCATCTG 
CTGGGCGAGC GCAGCGAAGT GTCCGATTCA CACCGCAACT GTGAAAAAGT GCAGGATCCG 
TACTCCCTGC GCTGCCAGCC GCAGGTGATG GGCGCCTGCC TGACGCAAAT TCGCCAGGCC 
GCCGAAGTGC TGGAAATTGA AGCCAACGCG GTCTCCGACA ACCCGTTGGT CTTTGCTGAC 
CAAGGCGACG TACTGTCCGG CGGTAACTTC CACGCCGAAC CGGTCGCCAT GGCCGCCGAC 
AATCTGGCGC TGGCGTTTGC CGAAATAGGT TCACTGTCCG AGCGCCGCAT CTCGCTGATG 
ATGGATAAAC ACATGTCGCA GCTGCCACCT TTCCTGGTGG ACAACGGCGG GGTGAACTCC 
GGCTTTATGA TTGCCCAGGT GACCGCCGCG GCGCTAACCA GCGAAAACAA AGCGCTGGCG 
CACCCGGCCA GCGTCGACAG CATTCCGACC TCGGCCAACC AGGAAGACCA CGTTTCCATG 
GCACCGGCCG CCGGTCGTCG CCTGTGGGAA ATGGCGGATA ACGTTCGCGG CATTCTGGCC 
GTCGAGTGGC TGGCAGCCTG TCAGGGGCTG GATCTGCGTA AAGGGCTGAA AACCACCGAA 
AGCCTGGAGC AGGCCCGCCG CACACTGCGC GAGCAAGTCA GTTACTACGA CAAGGATCGT 
TTCTTCGCTC CCGACATTGA AGCCGCCAGC CTGCTGTTGG CGGCCGGTCA CCTGACCTCG 
CTAATGCCTG CAGCACTGCT GCCTAGCCAG GCATAA

Protein sequence

MKALTIRPGQ LTLAQLREIY QHPVTLTLDD NAYADIQKSV ACVERIVEEN RTTYGINTGF 
GLLASTRIAR EDLEDLQRSI VLSHAAGVGA PTDDNLVRLI MVLKINSLSR GFSGIRLEVI 
EALMALVNAE VYPHIPLKGS VGASGDLAPL AHMSLVLLGE GKARYQGEWL PATEALAKAG 
LKPLTLAAKE GLALLNGTQV SAAFALRGLF DVEDLYAAAT VTGSLTVEAA LGSRSPFDAR 
IHAVRGQRGQ IDAAAAYRHL LGERSEVSDS HRNCEKVQDP YSLRCQPQVM GACLTQIRQA 
AEVLEIEANA VSDNPLVFAD QGDVLSGGNF HAEPVAMAAD NLALAFAEIG SLSERRISLM 
MDKHMSQLPP FLVDNGGVNS GFMIAQVTAA ALTSENKALA HPASVDSIPT SANQEDHVSM 
APAAGRRLWE MADNVRGILA VEWLAACQGL DLRKGLKTTE SLEQARRTLR EQVSYYDKDR 
FFAPDIEAAS LLLAAGHLTS LMPAALLPSQ A