Gene Rleg_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4005
Symbol
ID	8014814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4082512
End bp	4083702
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	63%
IMG OID	644826574
Product	aromatic amino acid aminotransferase
Protein accession	YP_002977785
Protein GI	241206689
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.143022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.2013
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGATG ATCTGATAAT GCCGCCAGCC GACAAGATCC TGTCGTTGAT GCCGATTTTC 
CGGCAGGACA GTCGTTCGAA CAAGATCGAT CTCGGCGTCG GAGTCTACCG GGACGCCTCC 
GGTACGACGC CGATCCCGCG GGCGGTGAGG GAGGCAGAAA AGCGAATCCA TACCGCGCAG 
ACGACCAAAG CCTATGTCGG CCCGGCCGGA GATCCTGTTT TCTGCGATCT CATCGGCAGG 
CTTGTCTTCG GCGAAGCCGC GCCGTGGGAG CGAATTCGCG GCATCCAGAC GCCGGGCGGA 
GCAGGCGCCT TGACGGTGCT CGCCGGCCTG ATCTCCCTGG CGCGCCCGGG TGCTGCGGTC 
CATGTGCCCG ACCCGACCTG GGTGAACCAT GTGTCGATCC TCGAAGACAA CCGGCTTCGG 
GTCGTCACTT ACCCTTACCT CGATCGCCGA ACAGGCGAGG TGGATTTCGA CGCCCTGCTC 
GATCATTTCT CACGGTCGGA GCGGGGCGAC ATCGTGTTGC TGCACGGCTG CTGCCACAAT 
CCGACCGGCG CCGACCCGAG CCGTTCGCAA TGGCAGGCGC TGGCAGAGAT CATCGCCGAG 
CGCGGGCTCG TTCCGCTGGT CGATATCGCT TATCAGGGGT TTGGCGAGGG TCTCGAGGAC 
GATGCCTTCG TGGTACGGCT GCTCACCGGC ATGGTTCCGG AAATGCTCGT CTCCTCGTCA 
TGCTCGAAGA ATTTCGGAAT CTATCGCGAG CGTACGGGTG CCGCATTCAT TCTCGCCGCG 
AACGCGGATC GGGCGGATGC AGCCAAGGCG CAACTCACAG TGCGAGCCCG TCTCGTCTAT 
TCGATGCCGC CGGATCATGG CGCGGCTATC GTTCGCACCG TCCTGGAAGA CCCGGCGCTT 
TCGGCCGACT GGCGCGCCGA ACTGGACGAT ATGCGCTCCA GCATTCTGTC GCTGCGCCAG 
GGGCTTGCTG CCTCGTTCCG GCGTTTCACC AATGGCAGCG ACTACGATTT CCTCGCCAAG 
AACAAAGGCA TGATTTCGCT GATCGGCCTG ACACCCGGAG AAGCCGTGAT GCTGCGCGAG 
CAGCACGCGA TCTACATCGT CGAGGACGGA CGCATCAATG TCGCCGGGCT GCAGGCCAGC 
CAGATCGACA CCTTTGCGGA AGCCGTTCTG GCAGTTCGCG GGAAACGCTG A

Protein sequence

MFDDLIMPPA DKILSLMPIF RQDSRSNKID LGVGVYRDAS GTTPIPRAVR EAEKRIHTAQ 
TTKAYVGPAG DPVFCDLIGR LVFGEAAPWE RIRGIQTPGG AGALTVLAGL ISLARPGAAV 
HVPDPTWVNH VSILEDNRLR VVTYPYLDRR TGEVDFDALL DHFSRSERGD IVLLHGCCHN 
PTGADPSRSQ WQALAEIIAE RGLVPLVDIA YQGFGEGLED DAFVVRLLTG MVPEMLVSSS 
CSKNFGIYRE RTGAAFILAA NADRADAAKA QLTVRARLVY SMPPDHGAAI VRTVLEDPAL 
SADWRAELDD MRSSILSLRQ GLAASFRRFT NGSDYDFLAK NKGMISLIGL TPGEAVMLRE 
QHAIYIVEDG RINVAGLQAS QIDTFAEAVL AVRGKR