Gene AnaeK_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_2046
Symbol
ID	6787897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	-
Start bp	2299841
End bp	2301367
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	77%
IMG OID	642763505
Product	histidine ammonia-lyase
Protein accession	YP_002134403
Protein GI	197122452
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.034077
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACCC TCCTCCTCGA CGGCGAGACC CTCACGCTGG AGCAGGTCCG CGCGGTCGCG 
ACCGGGGCCG CCCGCGCCGC GCTCGCCCCC GCGGCCCGCG AGCGCGTGCG GCGTTCCCGC 
GCGCTGGTGG ACGCCCGGCT CGAGGACGGC GAGGCGCACT ACGGCATCAA CACCGGCTTC 
GGGACGCTCG CCGAGGTCCG CATCCCGCGG GCCGACCTCG AGCGGCTGCA GCGCAACCTG 
GTGCTCTCGC ACGCCGCCGG CGTGGGCGCG CCGCTGCCCC TCCCGGAGGC GCGCGCGCTG 
GTGCTGCTGC GCGCCAACGT GCTCGCGAAG GGCGTCTCCG GGATCCGCGA GCGCACGCTG 
GACCTGCTGC TCGCGATGCT CGAGCGCGGG GTGGTGCCGG TGGTGCCGGA GCGCGGGTCG 
GTGGGCGCGT CGGGCGACCT CGCCCCGCTC GCGCACCTCG CGCTGGTGCT GATCGGCGAC 
GGCGAGGCGT TCCTCGCGCC GCCCGGCGCG GCGGGCCGGC CCGAGCGGCT CCCCGGCGGC 
GAGGCGCTGC GGCGGGCCGG GCTCGAGCCG GTGGTGCTGC AGCCGAAGGA GGGGCTGGCG 
CTCGTGAACG GCACCCAGGC CATGGCCGCG GTCGGCACGC TCGCGCTGCT CCGCGCCGAG 
CGGCTGGCGG CGCTCGCCGA TCTCGCGGGC GCCATGACGC TGGAGGGGCT GCTCGGCTCG 
CACCGGCCGT TCGCGCCGGA GATCCAGGCC GCCCGCGGGC AGCCCGGCCA GATCGCCGCG 
GCGGCGCACC TGCGCGCGCT GCTGGCCGGC TCCGAGCTGA ACGCCTCGCA CCAGGGCCCG 
GGCTGCCACA AGGTGCAGGA CCCCTACTCG CTCCGCTGCA TGCCGCAGGT GCACGGCGCC 
GCGCGCGACG GCATCGGCTT CTGCCGCGGG GTGCTGGCGC GCGAGGTGAA CGCCGCCACC 
GACAACCCGC TGGTCTTCCC GGACACCGGG GAGATCGTCT CGGGCGGCAA CTTCCACGGC 
CAGCCGGTGG CGCTCGCGCT CGACGTGCTC GCGGTGGCCG CCTCGCACCT CGCCGCCATC 
TCGGAGCGCC GCGTGGAGCA GCTCGTGAAC CCGTCGCTCT CCGGGCTGCC GCCGTTCCTG 
GCGCCCCAGC ACGGGCTCAA CTCGGGGTTC ATGATCGCGC AGGTGACCAG CGCGGCGCTC 
GTCTCGGAGA ACAAGGTGCT CTGCCACCCG GCCTCGGTGG ACTCGATCCC GTCCTCCGCC 
GGCCGCGAGG ACCACGTGTC GATGGGCATG ACCGCCGCGC TGAAGGCGCG CCAGGTGGTG 
GAGAACGTCC GCACCTGCCT CGCCATCGAG CTGCTGGTCG CGGCGCAGGC GCTCGATCTC 
CGGGCCCCGC TCCGCCCCGC CCAGCGCGTG GCCGAGGCGC ACGCCCGCCT GCGCGAGCGC 
GTCCCGCACC TGTCGGAGGA TCGGGCGCTG CACCGCGACA TCGAGGCGGT GTCGAGCCTG 
GTGGACGAGG GCGGGCTGGA GCTGTGA

Protein sequence

METLLLDGET LTLEQVRAVA TGAARAALAP AARERVRRSR ALVDARLEDG EAHYGINTGF 
GTLAEVRIPR ADLERLQRNL VLSHAAGVGA PLPLPEARAL VLLRANVLAK GVSGIRERTL 
DLLLAMLERG VVPVVPERGS VGASGDLAPL AHLALVLIGD GEAFLAPPGA AGRPERLPGG 
EALRRAGLEP VVLQPKEGLA LVNGTQAMAA VGTLALLRAE RLAALADLAG AMTLEGLLGS 
HRPFAPEIQA ARGQPGQIAA AAHLRALLAG SELNASHQGP GCHKVQDPYS LRCMPQVHGA 
ARDGIGFCRG VLAREVNAAT DNPLVFPDTG EIVSGGNFHG QPVALALDVL AVAASHLAAI 
SERRVEQLVN PSLSGLPPFL APQHGLNSGF MIAQVTSAAL VSENKVLCHP ASVDSIPSSA 
GREDHVSMGM TAALKARQVV ENVRTCLAIE LLVAAQALDL RAPLRPAQRV AEAHARLRER 
VPHLSEDRAL HRDIEAVSSL VDEGGLEL