Gene BURPS668_2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2667
Symbol	hutH
ID	4883057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2642715
End bp	2644238
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	71%
IMG OID	640128595
Product	histidine ammonia-lyase
Protein accession	YP_001059691
Protein GI	126438543
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0314474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACGC TGACCCCAGG CCGTCTGACT CTCCCGCAAC TGCGCCGGAT CGCCCGCGAG 
AACGTGCAGA TCGCGCTCGA TCCCGCGAGC TTCGCCGCGA TCGACCGGGG CGCGCAGGCC 
GTCGCCGACA TCGCCGCGAA GGGCGAGCCG GCGTACGGCA TCAACACGGG CTTCGGGCGC 
CTCGCGAGCA CGCACATTCC GCACGACCAG CTCGAGCTGC TGCAGAAGAA CCTCGTGCTG 
TCGCACGCGG TGGGCGTCGG CGAGCCGATG GCGCGCCCCG TCGTGCGCCT GTTGATGGCG 
CTCAAGCTCT CGAGCCTCGG CCGCGGCCAC TCGGGCATTC GTCGCGTCGT GATGGACGCG 
CTCGTCGCGC TGTTCAACGC GGACGTGCTG CCGCTCATTC CGGTCAAGGG CTCGGTGGGC 
GCGTCGGGCG ACCTTGCGCC GCTCGCGCAC ATGTCGGCCG TGCTGCTCGG CATCGGCGAC 
GTGTTCATCC GCGGCGAGCG CGCGAGCGCG GCCGAAGGGC TGCGTGTCGC GGGCCTCGCG 
CCGCTTACGC TCGAAGCGAA GGAGGGCCTC GCGCTGCTGA ACGGCACGCA GGCGTCGACC 
GCGCTCGCGC TCGACAACCT GTTCGCGATC GAGGACCTGT ACCGCACGGC GCTCGTGTCG 
GGCGCGCTGT CGGTCGACGC GGCGGCGGGC TCGGTGAAGC CGTTCGACGC GCGCATCCAC 
GAGCTGCGCG GCCATCGCGG CCAGATCGAC GCGGCCGCCG CGTACCGGTC GCTGCTCGAC 
GGCTCGGCGA TCAACGTGTC GCACCGCGAT TGCGACAAGG TGCAGGACCC GTACAGCCTG 
CGCTGCCAGC CGCAGGTGAT GGGCGCGTGT CTCGACCAGA TCCGCCACGC GGCCGGCGTG 
CTGCTCATCG AGGCGAACGC GGTGTCGGAC AACCCGCTGA TCTTCCCGGA CACGGGCGAG 
GTGCTGTCGG GCGGCAATTT CCACGCGGAG CCCGTCGCGT TCGCGGCCGA CAATCTCGCG 
ATCGCCGCGG CCGAGATCGG CGCGCTCGCC GAGCGCCGCA TCGCGCTGTT GATCGACGCG 
ACGCTCTCCG GCCTGCCGCC TTTCCTCGTG AAGGACGGCG GCGTGAACTC GGGCTTCATG 
ATCGCGCACG TGACGGCCGC CGCGCTCGCG TCGGAAAACA AGACGCTCGC GCATCCGGCG 
TCGGTCGATT CGCTGCCGAC GTCGGCGAAC CAGGAAGACC ACGTGTCGAT GGCGACGTTC 
GCCGCGCGCA AGCTCGCGGA CATCGCGGAG AACGTCGCGA ACATCCTCGC GATCGAGCTG 
CTCGCCGCGG CGCAAGGCGT CGACCTGCGC GCGCCGCACG CAACGAGCCC GGCGCTGCAG 
CACGCGATGA AGACGATTCG CGCGGACGTC GCGCACTACG ATCTCGACCA CTACTTCGCG 
CCCGACATCG CGGTGGTCGC GCGGCGCGTG CGCGAGCGCG CGTTCGCGAC GCTGAGCCCG 
CTGTCGTTCG AATCGGAACA ATAA

Protein sequence

MITLTPGRLT LPQLRRIARE NVQIALDPAS FAAIDRGAQA VADIAAKGEP AYGINTGFGR 
LASTHIPHDQ LELLQKNLVL SHAVGVGEPM ARPVVRLLMA LKLSSLGRGH SGIRRVVMDA 
LVALFNADVL PLIPVKGSVG ASGDLAPLAH MSAVLLGIGD VFIRGERASA AEGLRVAGLA 
PLTLEAKEGL ALLNGTQAST ALALDNLFAI EDLYRTALVS GALSVDAAAG SVKPFDARIH 
ELRGHRGQID AAAAYRSLLD GSAINVSHRD CDKVQDPYSL RCQPQVMGAC LDQIRHAAGV 
LLIEANAVSD NPLIFPDTGE VLSGGNFHAE PVAFAADNLA IAAAEIGALA ERRIALLIDA 
TLSGLPPFLV KDGGVNSGFM IAHVTAAALA SENKTLAHPA SVDSLPTSAN QEDHVSMATF 
AARKLADIAE NVANILAIEL LAAAQGVDLR APHATSPALQ HAMKTIRADV AHYDLDHYFA 
PDIAVVARRV RERAFATLSP LSFESEQ