Gene Vapar_0158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_0158
Symbol
ID	7971694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	159557
End bp	161110
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	70%
IMG OID	644790761
Product	histidine ammonia-lyase
Protein accession	YP_002942087
Protein GI	239813177
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAACAA GCAAACACAC CGCCACCCCC TTGATCCTCA CGCCCGGCAA GGTGGACCTT 
GCCATGCTGC GCCGCATCCA GGCCGGCGGC GTGCGGCTGG CGCTCGATCC TTCGGTGCAG 
GAGGGCATGG CGCGCGCCGA AGCGGCTGTG CGCCACATCG TCGAGAACGA CCAGGTGGTC 
TACGGCATCA ACACCGGCTT CGGCAAGCTC GCGAGCACGC GCATCGGCAA CGACCACCTG 
GCCGAGCTGC AGCGCAACCT CGTGCTCTCG CACAGCGTGG GCACGGGCGA GCCGCTGGCC 
GCGCCGGTGG TGCGCATGGT GCTCGCGACC AAGGCCGTGA GCCTGGCGCG CGGCCACTCG 
GGCGTGCGGC CCGCGCTGGC CGAGGCGCTG CTGGCGCTGT TCAATGCGGG CGTCATGCCG 
CGCATTCCGT GCAAGGGCTC GGTCGGCGCC TCGGGCGACC TCGCGCCGCT CGCGCACATG 
GCCTGCGTGC TGATCGGCGA GGGCGAGGCC ACCACGGCCG ACGGCGCCGT GGTCAGCGGC 
GCCGAAGCCA TGCGCCTCGT CGGCCTCGAA CCCTTTGTGC TCGGCCCCAA GGAAGGCCTG 
GCGCTGCTCA ACGGCACGCA GGTGTCGACC GCGCTCGCGC TCGCCGGCCT GTTCGGCGCG 
GAGGACGTGT TCGCTTCGGC GCTGATGTCG GGTGCGCTCT CGCTCGAAGC CATCCAGGGT 
TCGATCAAGC CCTTCGATGC GCGCATCCAT GCCGCGCGCG GCCAGCCGGG GCAGATCGCG 
GTGGCGGGCG CGGTGCGCAC GCTGCTCGAA GGCAGCGAGA TCGTCCCTTC GCACGCCGAC 
TGCGGCCGCG TGCAGGACCC GTATTCGGTG CGCTGCATTC CGCAGGTGAT GGGCGCCTGC 
CTCGACAACC TCGCGCATGC CGCGCGCGTG CTGGTGATCG AGGCCAATGC CGCCTCGGAC 
AACCCGCTGG TGTTCACCGA CACCGGCGAA GTGATCTCGG GCGGCAACTT CCACGCCGAG 
CCGGTGGCCT TTGCGGCCGA CATCATTGCG CTGGCAGTGA GCGAAGTGGG CGCGATTGCC 
GAGCGCCGCA TCGCGCTGCT GCTCGACACC GGCCTGTCGG GCCTGCCGCC GTTCCTGGTG 
CGCGATGGCG GCCTGAACTC GGGCTTCATG ATCGCGCAGG TCACGGCCGC GGCGCTGGCG 
TCGGAGAACA AGTCGCTCGC GCATCCCGCG AGCGTCGACA GCCTGCCCAC TTCGGCCAAC 
CAGGAAGACC ACGTGTCGAT GGCCACCTTC GCGGCGCGCC GGCTCGGCGA CATGGTCAAC 
AACACGGCGG TGGTCGTCGG CATCGAGGCG ATGGCCGCGG CACAAGGCAT CGAACTCAAG 
CGGGGGCTCA AGAGCTCCCC GCTGGTCGAA GCCGAATTCG CCGCCATCCG CCAGAAGGTC 
GCTTTTCTCG AACGCGACCG CTACCTTGCG CCCGACATCG AAGCGATGCG CCAGTGGGCG 
CTGAAGGCCG AGCTGCCGGC CGCGCTCTTG AACATCCTGC CCAGCCACGC CTGA

Protein sequence

MPTSKHTATP LILTPGKVDL AMLRRIQAGG VRLALDPSVQ EGMARAEAAV RHIVENDQVV 
YGINTGFGKL ASTRIGNDHL AELQRNLVLS HSVGTGEPLA APVVRMVLAT KAVSLARGHS 
GVRPALAEAL LALFNAGVMP RIPCKGSVGA SGDLAPLAHM ACVLIGEGEA TTADGAVVSG 
AEAMRLVGLE PFVLGPKEGL ALLNGTQVST ALALAGLFGA EDVFASALMS GALSLEAIQG 
SIKPFDARIH AARGQPGQIA VAGAVRTLLE GSEIVPSHAD CGRVQDPYSV RCIPQVMGAC 
LDNLAHAARV LVIEANAASD NPLVFTDTGE VISGGNFHAE PVAFAADIIA LAVSEVGAIA 
ERRIALLLDT GLSGLPPFLV RDGGLNSGFM IAQVTAAALA SENKSLAHPA SVDSLPTSAN 
QEDHVSMATF AARRLGDMVN NTAVVVGIEA MAAAQGIELK RGLKSSPLVE AEFAAIRQKV 
AFLERDRYLA PDIEAMRQWA LKAELPAALL NILPSHA