Gene Rleg2_5918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5918
Symbol
ID	6977305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	-
Start bp	336125
End bp	337618
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	68%
IMG OID	643393371
Product	phenylalanine/histidine ammonia-lyase
Protein accession	YP_002278189
Protein GI	209546299
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.18522
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCA ACATCGAGAC CGTGCTGACC TGGTGCGATG TCGCGCGCGT CGGGGCAGGG 
GAGGCGCTGA CGCTGTCGCC GGCCGCCTGG GCGCGGGTCG AGCAGGCAAG CCGCATCGTC 
GCCAGCATCG TCGAGACAGG CATGCGCGCC TATGGCGTCA ACACCGGCGT CGGGGCGCTC 
GCCGATACCG TCGTCGATCG GGCCTCGCAG AGCCTGTTGT CGCGCAGCAT CGTGCTCAGC 
CACGCCTGCG GCGTCGGGCC GTTGCTTGGG TCACATGAGG TGCGCGCCAT CATCGCCGCC 
CAGATCGCCA ATTTTGCCCA TGGCCATTCC GGCGTGCGGC GCGAGATCGT CCAGCATCTC 
ACGGCCATGT TGGAGCATGA CTGCATTCCC GACGTGCCGT CCAAGGGCTC GGCCGGTTAT 
CTCACCCACA ATGCCCATAC CGCGCTGGTT CTGATCGGCG AAGGCAGCGC GACACTCGCC 
GGCCGGCGCT TAAGCGGTCG CGAGGCGCTG GCCGCGATCG GCCTCGAACC GCTGGTGCTC 
GGCGCCAAGG AGGGCTTGAG CCTCGTCAAC GGCACCGCCT GCGCCACCGG CCTGACCGCC 
ACCGCGCTGT TGCGCGCCGA AAAACTGCTC GACTGGGCCG ATGCCATCGC GGCGCTGACG 
CTGGAGGCGG CAGGCTGCCA GATCGCCGCC TTCGACGAGG CGGTGCTGGC GCTGCGCCCG 
TCTGCCGGAA TCGAAAAAGT CGGAGCCACC TTGCGCGCTA GGCTTCGGGG CAGCGGCCTT 
GTCGCCGTCG CCTCTGGCCG GCGCACCCAG GATGCGCTGA GCCTTCGCTC GGTACCGCAT 
GCCCATGGCG CCGCCCGCGA TGTCTTCGAC AATTCCGCCC ATATCGCCGA TCAGGAACTT 
GCCTCGGTCA CCGACAATCC TGCGGTGTCA GGCACGCCGG AACAGCCGAT CGTTTCCTCC 
GAGGCCCATG CGGTGGCGCC GGCGCTCGGG CAGGCGGCTG ATAGCCTCGC TATTGCTCTG 
GCGCAGATCG GCGCGATCAG CGAAAGGCGC ATGGACCGGC TGGTCAATCC GCTGGTGAGC 
GGCCTGCCGT CCTTCCTGGC GAGTGACGCC GGCAGCCATT CCGGCTTCAT GATCGCCCAA 
TATACCGCGG CAGCCCTCAG CAACGAAAAC CGCCGGCTCG CCGCGCCCGC GGCCATGGAT 
GGCGGCCTGA CCTCCGGTCT GCAGGAGGAT TTCCTCGCAC ATCCGACCGC CGCCGCCGGC 
AAGCTGCTCG CCGTCATCGA CAATGCCGAA TATATTCTGG CGATCGAGCT GATGGCGGGG 
GCCCAGGCGC ATGATTTCCT GGCGGCGACC GCGCCGCGGG CGCCAGGCAC GGATCTCGTC 
TATCAGGCGG TGCGGGAGCG TATCTCCCAT TATGGCGACG AGCGGCCGCT CAACGGCGAT 
ATCGAGGCCG TGCGCAGCCT GATCCGCGAG ACGCTGCCGC CGGCAATCGT CTGA

Protein sequence

MTINIETVLT WCDVARVGAG EALTLSPAAW ARVEQASRIV ASIVETGMRA YGVNTGVGAL 
ADTVVDRASQ SLLSRSIVLS HACGVGPLLG SHEVRAIIAA QIANFAHGHS GVRREIVQHL 
TAMLEHDCIP DVPSKGSAGY LTHNAHTALV LIGEGSATLA GRRLSGREAL AAIGLEPLVL 
GAKEGLSLVN GTACATGLTA TALLRAEKLL DWADAIAALT LEAAGCQIAA FDEAVLALRP 
SAGIEKVGAT LRARLRGSGL VAVASGRRTQ DALSLRSVPH AHGAARDVFD NSAHIADQEL 
ASVTDNPAVS GTPEQPIVSS EAHAVAPALG QAADSLAIAL AQIGAISERR MDRLVNPLVS 
GLPSFLASDA GSHSGFMIAQ YTAAALSNEN RRLAAPAAMD GGLTSGLQED FLAHPTAAAG 
KLLAVIDNAE YILAIELMAG AQAHDFLAAT APRAPGTDLV YQAVRERISH YGDERPLNGD 
IEAVRSLIRE TLPPAIV