Gene Rleg_6046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6046
Symbol
ID	8016308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	+
Start bp	79320
End bp	80354
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	60%
IMG OID	644827354
Product	hypothetical protein
Protein accession	YP_002978554
Protein GI	241258670
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.588241
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAAT TCAGCTTCAC CGAAATCTGC CTGCATCAGT TGAAGATGTC GGGCGTCCAC 
GAGGGCGAAA AACTCATCGT CCTGACCCAG GGCAACGAGC GCCTCGATTA TGCCGACGCC 
TTCATGGCGG CGGGCATGCG TCTTGGGGCC AAGATGTATC ACATGCGTTT ACCGCCGGTG 
CCACCGGCGG GTGCATGGGC CGTCGGCCAG ACAGGCCTAG CGGCCATGCC TGACGCGGTC 
GAGGCCCTGA AGGCCGCCGA CATGCTGATC GATTGCATCT TCCTGCTCTT CAGCCCGGAA 
CAGATGGCGA TCCAGGCGGC CGGAACGCGC ATCCTGACCG CCGTCGAACC GCCGGAAATT 
CTTGCCCGCA TGTTGCCGAC AAAGGAACTG CGCGAGCGCG TCGAATTTGC AGGAGACCTG 
CTGTCCAAGG CGAAGGTGAT GCGGATCACC TCGGACCATG GCACGGATGT CACCTACAAG 
CTCAACACCT ATCCGGCCGT CACGGAATAT GCGTGCACGG ACGAACCGGG CCGCTGGGAT 
CATTGGCCAT CCGGCTTTGT CTTCACCGGT GGTGACGATG ACGGCGTCGA CGGTACGATC 
GTCGTTGCTC CGGGCGATAT TCTGCTGCCG CAGAACATCT ACGTGCGCGA TCCGATCTAC 
TACACCATTG AAAACGGTTG GATCACCGAC ATTCGCGGTG GCCTCGACGC CGAGCTAGTC 
AAATCCTACA TGGACGGTTT CAACGATCCG CGTGGCATGG GCATGAGCCA TGTCGGCTGG 
GGTCTTAATC AAAACGCCAA GTGGCATCGC ATGGTGCCCG GCGAATTTCC GGGCGGCATG 
GGCATGGAGG CCCGCTCGTT CTACGGCAAT GTCATGTTCT CGACCGGCCC GAACAATGAA 
TTGGGCGGCC CGAACGACAC GGCCTGCCAT CTCGATATCC CGATGCGCAA TTGCTCGCTC 
TTTCTCGACG ATGAGCCGAT GGTCCTGAAC GGCGATATCG CCGTCAAGGA AATGAAGCAC 
ACCGTCAAAT CGTAA

Protein sequence

MDQFSFTEIC LHQLKMSGVH EGEKLIVLTQ GNERLDYADA FMAAGMRLGA KMYHMRLPPV 
PPAGAWAVGQ TGLAAMPDAV EALKAADMLI DCIFLLFSPE QMAIQAAGTR ILTAVEPPEI 
LARMLPTKEL RERVEFAGDL LSKAKVMRIT SDHGTDVTYK LNTYPAVTEY ACTDEPGRWD 
HWPSGFVFTG GDDDGVDGTI VVAPGDILLP QNIYVRDPIY YTIENGWITD IRGGLDAELV 
KSYMDGFNDP RGMGMSHVGW GLNQNAKWHR MVPGEFPGGM GMEARSFYGN VMFSTGPNNE 
LGGPNDTACH LDIPMRNCSL FLDDEPMVLN GDIAVKEMKH TVKS