Gene Rleg_4551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4551
Symbol
ID	8015943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4680148
End bp	4681401
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	62%
IMG OID	644827128
Product	peptidase M29 aminopeptidase II
Protein accession	YP_002978328
Protein GI	241207232
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.123351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTCA TGCCCCAGAG CCAGAACACA ATTGATCCCG TCAAGCTGGA AAAACTTGCG 
GAAGTCGCCG TCAAGGTCGG GCTGCAGCTG CAAAAAGGTC AGGATCTGGT GATCACCGCG 
CCTGTCGTGG CGCTGCCGCT GGTTCGCCTG ATCACCAAGC ATGCCTATCT GGCCGGCGCC 
GGACTGGTCT CCGCCTTCTA TTCCGACGAG GAAACGACGC TGGCGCGCTA TCAATATGGC 
AGCGACGAGA GCTTCGACCG CGCCTCCGGC TGGCTCTACG AGGGCATGGC CAAGGCCTAT 
GCCAACGGGG CGGCCCGTCT TGCGGTCGCC GGCGACAATC CGATGCTGCT GTCCGAGCAG 
GATGCCGGCA AGGTCGGCCG CGCCAATCGC GCCAACTCAA CGGCCTACAA GCCGGCGCTG 
GAGAAGATCT CGAATTTCGA CATCAACTGG AACATCGTCT CCTACCCGAA CCCATCCTGG 
GCCAAGGTGG TCTTCCCCGA CGATCCGGAA CCGATTGCGA TTGCCAAGCT CGCCAAGGCG 
ATCTTTGCCG CCTCGCGCGT CGATGTCAGC GATCCCGTCG CCGCCTGGGC CGAGCACAAT 
GCCAATCTTG GCAAGCGATC CGCCTGGCTG AACGGCGAGC GTTTCGCCTC GCTGCATTTC 
CAGGGACCGG GTACCGACCT GACGATCGGC CTTGCCGACG GGCATGAATG GCATGGCGGC 
GCTTCCACCG CCAAGAACGG CATTACCTGC AATCCGAACA TCCCGACCGA GGAAGTCTTC 
ACCACGCCGC ATGCGCTGCG CGTCGAAGGC CATGTGTCGA GCACCAAGCC GCTCTCGCAC 
CAGGGCACGT TGATCGACAA TATCCAGGTA CGTTTCGAGG GTGGGCGCAT CGTCGAGGCC 
AAGGCCTCGC GCGGCGAAGA GGTCTTGAAC AAGGTGCTCG ATACCGACGA GGGCGCGCGC 
CGGCTCGGCG AAGTGGCGCT GGTGCCGCAT TCCTCACCGA TCTCGGCCAG CGGCATCCTG 
TTCTACAACA CGCTGTTCGA CGAAAACGCC TCGTGCCACA TCGCACTCGG CCAGTGCTAT 
TCCAAGTGCT TCCTCGATGG CGCGACACTG AGCCAGGAGC AGATCAAGGC GCAGGGCGGC 
AATTCCAGCC TGATCCATAT CGACTGGATG ATCGGCTCGG ACAAAGTCGA TATCGACGGC 
ATCAAGCCGG ATGGTTCACG GGTTCCGGTG ATGCGGCAGG GCGAATGGGC CTGA

Protein sequence

MTFMPQSQNT IDPVKLEKLA EVAVKVGLQL QKGQDLVITA PVVALPLVRL ITKHAYLAGA 
GLVSAFYSDE ETTLARYQYG SDESFDRASG WLYEGMAKAY ANGAARLAVA GDNPMLLSEQ 
DAGKVGRANR ANSTAYKPAL EKISNFDINW NIVSYPNPSW AKVVFPDDPE PIAIAKLAKA 
IFAASRVDVS DPVAAWAEHN ANLGKRSAWL NGERFASLHF QGPGTDLTIG LADGHEWHGG 
ASTAKNGITC NPNIPTEEVF TTPHALRVEG HVSSTKPLSH QGTLIDNIQV RFEGGRIVEA 
KASRGEEVLN KVLDTDEGAR RLGEVALVPH SSPISASGIL FYNTLFDENA SCHIALGQCY 
SKCFLDGATL SQEQIKAQGG NSSLIHIDWM IGSDKVDIDG IKPDGSRVPV MRQGEWA