Gene Smed_5411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5411
Symbol
ID	5319713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	373928
End bp	375172
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	640777177
Product	peptidase T
Protein accession	YP_001314109
Protein GI	150377514
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.683579
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.180292
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACGC GCGACGAGCT GGTCAGCCGG TTTTTCCGGT ACGTGGCCAT TGAGAGCCAG 
AGTAACGGTC ACTCTGCGTC CCTGCCCTCC TCCCCCGGCC AGTTCGAGCT TGCCTCCTTG 
CTGGCCGAAG AGTTGCGGAT GCTCGGGGTC GAGGACGTCG TGCTCGACGA GCAGGCGATT 
GTGACCGGCG TGAAGCGCGG CACCAGGCCC AATGCGCCAA GGATCGGGTT CATCGCGCAT 
CTCGATACGG TTGATGTCGG TCTCTCTGCC ATTATCCGGC CGCAAATTCT CCGGTTCGAA 
GGCACGGACC TTTGCCTCAA CCCTCAGGAG GACATCTGGC TGCGCGTCGC CGAACACCCG 
GAACTCCTCG CCTGGCCGGG GGAAGACATC ATCGTCAGCG ACGGCACCAG CGTGCTCGGC 
GCGGACAACA AGGCGGCGAT CGCGGTCATC ATGACACTTC TCGCCCGGCT CGATGCGCAA 
GGCGCCCATG GCGACGTCTT CGTCGCCTTC GTGCCGGACG AGGAAATCGG TCTGCGCGGC 
GCCAAGGCGC TCGATCTGGC GCGCTTTGCA TGTGACTTCG CCTACACGAT CGATTGTTGC 
GAGCTCGGCG AAGTCGTGCT CGAGACCTTC AACGCCGCAT CGGCTGAAAT CGTCTTTACC 
GGCGTCAGCG CACACCCGAT GGCCGCAAAG GGCACCCTCG TGAACCCGCT TTTGATGGCG 
CTGGACTTCG TCTCGCACTT TGATCGCAAG GATACACCTG AATGCACGCA GGATCGGCAA 
GGCTTCTTCT GGTTCAAAGA GCTTGTTGCG CATGACAGCA AGGCAACACT CAACGTGCTC 
ATTCGCGACT TCGATGCGGC AGAATTCGAA CGGCGCAAGC AGCAGCTCCT TGCCATAACG 
GCGCTGGTCA ACGCGCACTA TCCCTCCGGC CGCGTCGAGT GCCGGTTGAC CGACACCTAC 
CACAATATCG GCCGCCGCCT GCGCGACGAC AGCCGCCCGG GAACGCTGTT GTTCCAGGCT 
TTCGACGCAC TCGGGATTGA ACGAAAGCGC ATTCCGATGC GCGGCGGCAC CGATGGCGCC 
GTCCTCTCGG CACGGGGAAT ACCGACGCCA AACTTCTTCA CCGGCGCCTA CAACTTCCAT 
TCCCGATTTG AATTCCTGCC GGTCTCAGCT TTCGAAAAGT CGTTCGAGGT TGCAGGCATG 
CTTTGCAAAC TGGCGGCCCA GGACGAGGCG TTGGCCGACC GCTAA

Protein sequence

MRTRDELVSR FFRYVAIESQ SNGHSASLPS SPGQFELASL LAEELRMLGV EDVVLDEQAI 
VTGVKRGTRP NAPRIGFIAH LDTVDVGLSA IIRPQILRFE GTDLCLNPQE DIWLRVAEHP 
ELLAWPGEDI IVSDGTSVLG ADNKAAIAVI MTLLARLDAQ GAHGDVFVAF VPDEEIGLRG 
AKALDLARFA CDFAYTIDCC ELGEVVLETF NAASAEIVFT GVSAHPMAAK GTLVNPLLMA 
LDFVSHFDRK DTPECTQDRQ GFFWFKELVA HDSKATLNVL IRDFDAAEFE RRKQQLLAIT 
ALVNAHYPSG RVECRLTDTY HNIGRRLRDD SRPGTLLFQA FDALGIERKR IPMRGGTDGA 
VLSARGIPTP NFFTGAYNFH SRFEFLPVSA FEKSFEVAGM LCKLAAQDEA LADR