Gene Smed_5624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5624
Symbol
ID	5319926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	592144
End bp	593433
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	63%
IMG OID	640777367
Product	integrase catalytic region
Protein accession	YP_001314299
Protein GI	150377704
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.205652
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.723097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGCG CGATTTTATC GCATCCTGCA TTGTCGCTAA CGATGCAGGG CGGGGATATG 
CTTCAGGCTG ACGAGGTGGT GGCAATGCTG CGGCTGCACG AGCTTGGTTG GGGTAGCAAA 
CGTCTATCGA AAGAATTTGG ATGCGCGCGG AATACCGTTC GCCGATATCT TCGAGAGGGC 
GGAGCTGTAC CGTTTAAACA GCCTGCCCGG CGCAGTGCGT TCGACGGGCT TGATGATTGG 
CTTCGCGAGC GTTTTTTCCG GCATGACGGT AATGCGGATG TGATCCGCCA AGAGTTGGCG 
AGCGAGCACG GAATTGTCAT CGGTCTGCGT TCTGTGGAGC TCCGCGTACG GCAGTGGCGG 
CGAGAGCTAA AGGCACAGAA GCGGGCGACG GTCCGCTTCG AGACGGCGCC GGGCCATCAG 
ATGCAGATCG ACTTCGGTGA CACGAAGGTG TGGATCGGCG ACGAGCGGGT TCGGATTCAC 
CTGTTCGTGG GGACGCTGGG GTATTCGCGG CGGATGCATG CTCGCGCGTC ACTCAGGGAG 
CGCCAGGCAG ACTGGTTTGA AGGCATGGAA GGCGCTTTCC TGCGGTTCGG CGGGGTTCCG 
GTGGAAGTGC TGATCGACAA TGCGAAGGCC CTGGTCGAAC ATCATGATCC GGTGACGCGA 
GAGGTGAGAT TCAACGCGCG ACTGCATGCT TTCGCCCGTT ATTGGGGCTT CACGCCGCGG 
GCCTGCGCAC CGTATCGGGC GAGAACGAAA GGCAAAGACG AGCGCGGGGT CGGTTACGTC 
AAGAAGAACG CGATCGCCGG GCGCCGCTTC GAGAGCTGGG CCGAGTTTGA AGCGCATCTG 
GATCGATGGA CACGCGAAGT TGCCGACCAG CGTGAACACG GCACCACCGG TGTCAAACCG 
GCGGAACGCT TTGCCGACGA AGCCAGGGAG CTGCGCCCGC TGGCCGGACG GGCACCCTTC 
GGGCAATTGC GGGATCTGGT TCGCAAGGTT CAAGCCGATT GCGCGATCGA CCTCGACACC 
AACAGCTACT CGGTGCCCTG GCGCCTGATC GGCGAGAGTG TTCAGGTCGT GGTGTTGGCG 
GGGCGCGTCA TCATCCGGCA TGCGGGCCAG GTGGTGGCTG ATCATGCCCT GTGCGATGGA 
CGACGACAAC GGATCGTGGA CCGGGCGCAT TTTGTCGGTG TTGCCGGCGC CGAGGGTCTG 
GTGCGAGCCG CCGCTCCCAT CGAGCTCCCC CCTCCCACCC TGTTGCGCCC GCTTGCGGAA 
TACGAGGCGG TTGCCGGAGG AGGCTGGTGA

Protein sequence

MTSAILSHPA LSLTMQGGDM LQADEVVAML RLHELGWGSK RLSKEFGCAR NTVRRYLREG 
GAVPFKQPAR RSAFDGLDDW LRERFFRHDG NADVIRQELA SEHGIVIGLR SVELRVRQWR 
RELKAQKRAT VRFETAPGHQ MQIDFGDTKV WIGDERVRIH LFVGTLGYSR RMHARASLRE 
RQADWFEGME GAFLRFGGVP VEVLIDNAKA LVEHHDPVTR EVRFNARLHA FARYWGFTPR 
ACAPYRARTK GKDERGVGYV KKNAIAGRRF ESWAEFEAHL DRWTREVADQ REHGTTGVKP 
AERFADEARE LRPLAGRAPF GQLRDLVRKV QADCAIDLDT NSYSVPWRLI GESVQVVVLA 
GRVIIRHAGQ VVADHALCDG RRQRIVDRAH FVGVAGAEGL VRAAAPIELP PPTLLRPLAE 
YEAVAGGGW