Gene Spea_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spea_3894
Symbol
ID	5664278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella pealeana ATCC 700345
Kingdom	Bacteria
Replicon accession	NC_009901
Strand	+
Start bp	4740218
End bp	4741780
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	51%
IMG OID	641238558
Product	histidine ammonia-lyase
Protein accession	YP_001503739
Protein GI	157963705
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase [TIGR01226] phenylalanine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAAG ATAATACCTA TAACCTTAGC CAGCAAACCG TTGAATTTGG CTATAACAGC 
CTATCGCTTG AAGATGTGGT GGCTATCGCC AAAGGCGCAA CAGCCAAGCT GAATCAAACG 
ACCGAATACC GCAGCTATAT TCAAAAAGGC GCGCTGTTTA TCGATAGCCT GCTTAAAGAA 
GAGGGCGTGG TTTACGGCGT CACTACAGGT TATGGTGATT CTTGTACTGT CACTGTGGGT 
CTTGACTTGG TTCATGAGCT ACCGCTGCAC CTGACTCGTT TTCATGGCTG TGGTATGGGT 
GAGATCCTGT CGCCGATGCA AGCTCGCGCC GTGATGGCAT GCCGACTTAG CTCGCTAGCT 
GTCGGTAAAT CTGGGGTCAC TTTCGAGCTA CTTGAGCGTA TCGAAACCCT GCTTAATCTT 
AATATTACTC CGGTGATCCC CGAAGAGGGC TCAGTTGGCG CCAGTGGCGA CTTAACGCCA 
CTATCTTATC TAGCAGCGGT ATTGATCGGC GAGCGCGATG TGATTTACCA AGGTGAACGA 
CGCCCAACTA GCCAAGTGTA CCAAGAGCTT AATATCGTAC CGCTAAAACT TCGTCCGAAA 
GAAGGCCTAG CGCTAATGAA CGGCACTGCG GTCATGACGG CGCTAGCTTG TTTAGCCTAT 
GACAGAGCCC AGTACATGGC GCGTCTTGCC AGCCGTATCA CCGCCATGGC ATCACTGACC 
CTTAAAGGTA ACTCGAATCA CTTCGACGAC ATCTTATTTG CCGCTAAGCC GCACCCGGGC 
CAGAACCAAA TCGCTGCTTG GATCCGTGAA GACTTGAATC ATCATATTCA TCCACGTAAC 
TCCGACAGAC TGCAAGACAG ATACTCTATC CGCTGTGCAC CCCATGTGAT TGGTGTGCTA 
CAAGACGCGC TGCCGTTTAT GCGTCAGTTT ATTGAAACTG AACTCAACAG CGCCAACGAC 
AACCCAATTG TTGATGGTGA AGGCGAGCAT ATTCTACATG GCGGTCACTT CTATGGCGGC 
CACATCGCCT TTGCCATGGA TGCGATGAAA AATGCGGTAG CCAATATTGC CGATCTTATC 
GATCGCCAGA TGGCATTAGT CATGGATCAG AAATTCAATA ACGGTTTACC GGCCAACTTA 
TCGGGCGCTC AAGGCAGACG TAAGGCGATT AACCACGGCT TTAAAGCGGT GCAGATTGGC 
GTATCCGCGT GGACGGCTGA AGCCCTGAAA AACACCATGC CAGCCAGCGT GTTCTCACGC 
TCTACCGAGT GCCATAACCA AGATAAGGTC AGCATGGGCA CCATCTCGGC TCGTGATTGT 
ATGCGCGTAT TACAACTGAC CGAGCAAGTC GCTGCGGCGG CGTTACTGGC CATGTCGCAA 
GGTATTCGCC TGCGCATTGC TCAAGAGGAG CTCGTCGAAA GCTCGATTAC ACCTTCTTTA 
GCCAATACCC TTGCTCAAGT TGAAGCCGAC TTTGAATTAT TAACTGAAGA TAGACCGCTA 
GAGCAGACCC TACGCTCTAC CGTCGATAAG ATCCAAAATG GCTACTGGGA AGTGTGCGGT 
TAA

Protein sequence

MTQDNTYNLS QQTVEFGYNS LSLEDVVAIA KGATAKLNQT TEYRSYIQKG ALFIDSLLKE 
EGVVYGVTTG YGDSCTVTVG LDLVHELPLH LTRFHGCGMG EILSPMQARA VMACRLSSLA 
VGKSGVTFEL LERIETLLNL NITPVIPEEG SVGASGDLTP LSYLAAVLIG ERDVIYQGER 
RPTSQVYQEL NIVPLKLRPK EGLALMNGTA VMTALACLAY DRAQYMARLA SRITAMASLT 
LKGNSNHFDD ILFAAKPHPG QNQIAAWIRE DLNHHIHPRN SDRLQDRYSI RCAPHVIGVL 
QDALPFMRQF IETELNSAND NPIVDGEGEH ILHGGHFYGG HIAFAMDAMK NAVANIADLI 
DRQMALVMDQ KFNNGLPANL SGAQGRRKAI NHGFKAVQIG VSAWTAEALK NTMPASVFSR 
STECHNQDKV SMGTISARDC MRVLQLTEQV AAAALLAMSQ GIRLRIAQEE LVESSITPSL 
ANTLAQVEAD FELLTEDRPL EQTLRSTVDK IQNGYWEVCG