Gene Smed_3190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3190
Symbol
ID	5324069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3360430
End bp	3362136
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	64%
IMG OID	640792138
Product	heparinase II/III family protein
Protein accession	YP_001328849
Protein GI	150398382
COG category	[S] Function unknown
COG ID	[COG5360] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAACT TACGGGCGCC GATGCCGCTT TCCAATAAAC CAAGGTTCCT ATATCTGTAC 
CTGCGCGAAG GCACACGGCG GCTTGAGCGC CGGCTTTCGC TTGGCCGGAC CGCGGCGCAG 
CGCTATGCCG GCTCAACGCC CGTCCGCCTC ATCGTCGCGC CGACGGACCT TCGCGCAATA 
GACCCATTCG TTGCGGAGGA GATCCTCGCA GGCCGGTTTC CGCTCGCCGG GCGGGTTCTG 
GATACCGAAG GTGAGTCGGC TTTCGAGATC GATCTGCCGT CTTACGAATT CGCGATCCGC 
CTCCATTCCT TCGGCTGGCT GCGTCACATG CGGGCAGTCC AGGATGAAGC CGGCTCGGCC 
AGGCTGCGCC AGATTGTCGA CGACTGGATG GGGAGCCATG GCCGAACTAT CGGTGAAATC 
TCGTGGGACG CGGACGTGGT GGCACAGCGC GTCATCGCCT GGCTGTCCCA CTCGCCGGTC 
GTGCTGCGCA ATGCCGAGCA TGGCTTTTAT CGCCGATTCC TGAAGAGCCT GGCCCTCCAG 
GTGCGTCATC TCCGGCATGT TGCCGGGACC GTGCCCGATG GAGAGGCACG GCTGAGGGTT 
CGCCTTGCGC TCGCGATGGC CTCCGTCTCG ATGCCGGCGA CGGCTTCGGC GATCCGCAGG 
GCGTCCCGCA ATCTCGATCT CGAGCTGGAA CGGCAGATCC TCCCGGACGG AGCGCATTTC 
TCCCGCAATC CACGGGCGGG GCTCGAGCTC CTGCTCGATC TGCTGCCGCT GCGTCAGACA 
TATGTCAATC TCGGACACGA CGTGCCTTCG AAGCTGATTT CCTGTATCGA CCGCATGTAT 
CCGGCGCTCC GCTTCTTCCG TCACCAAAGC GGCGAGCTCG CCCTTTTCAA CAGCGCGACA 
TCCGTTGCTG CCCATGAGCT CGCCTCTGTG CTCAGATATG ACGAGACCGC TGGCGAACCT 
TTCCGATCGC TTCCGCATGC GCAATACGAA CGCCTGTCGC TGGGTGAAAC CGTCGTCATC 
GTGGACACCG GGCGGCCACT ATCGGTCGAT CTGTCGCGCA GTGCCCATGC AGGCTGTCTC 
TCTTTCGAGA TGTCCTCCGG CCGGAATCGC TTCGTCATCA ATTCCGGCGC GCCGAAATTC 
GCCGGCGATC GATTTCGGCA AATGGCGCGC ACCACGGCAG CGCATTCCAC TGTCACCCTG 
AACGACAGAT CCTCTTGCCG CTTCTCGCAG TCGCGATTCC TCGGTCCGAT CGTGGCCGGG 
GGGCCGTCCC GCGTCGCGGT CGAGAGGAAG GACGAGCCAG GCAGAATGGA GACGGTCAAG 
GCGAGCCATG ACGGCTATGT TGCGCCCTTC GGACTGCTCC ACGAGCGTGA CATCGGAATA 
CTCAATGGAG GCCGGCTGAT TCGCGGTCGC GACCGCCTGT TGCTCGAGGA CGGCGGCGAC 
CCTGATCCGG AGGACGGCTC GATCGCCATC GCCCGATTCC ACATTCATCC GGCGATCGGC 
ATGCGCCGGC ACAGCGAGAG CGAAATATAC CTGACGGCGC CCGACGGTGA GGCTTGGCTC 
TTCGCATGTC GGGACGGCAA GCTCGCCGTG GAGGAGGACA TCTTCTTCGC CGATCCCTCC 
GGCGTGCGCG CCTCGTCGCA GATCACGGTG ACTTTCGCCG CCGGCGACCA GCCCGAAATC 
CAGTGGACTT TCACGCGGGC AGCATGA

Protein sequence

MRNLRAPMPL SNKPRFLYLY LREGTRRLER RLSLGRTAAQ RYAGSTPVRL IVAPTDLRAI 
DPFVAEEILA GRFPLAGRVL DTEGESAFEI DLPSYEFAIR LHSFGWLRHM RAVQDEAGSA 
RLRQIVDDWM GSHGRTIGEI SWDADVVAQR VIAWLSHSPV VLRNAEHGFY RRFLKSLALQ 
VRHLRHVAGT VPDGEARLRV RLALAMASVS MPATASAIRR ASRNLDLELE RQILPDGAHF 
SRNPRAGLEL LLDLLPLRQT YVNLGHDVPS KLISCIDRMY PALRFFRHQS GELALFNSAT 
SVAAHELASV LRYDETAGEP FRSLPHAQYE RLSLGETVVI VDTGRPLSVD LSRSAHAGCL 
SFEMSSGRNR FVINSGAPKF AGDRFRQMAR TTAAHSTVTL NDRSSCRFSQ SRFLGPIVAG 
GPSRVAVERK DEPGRMETVK ASHDGYVAPF GLLHERDIGI LNGGRLIRGR DRLLLEDGGD 
PDPEDGSIAI ARFHIHPAIG MRRHSESEIY LTAPDGEAWL FACRDGKLAV EEDIFFADPS 
GVRASSQITV TFAAGDQPEI QWTFTRAA