Gene Smed_1348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1348
Symbol
ID	5322196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1432667
End bp	1433842
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	57%
IMG OID	640790290
Product	phage integrase family protein
Protein accession	YP_001327033
Protein GI	150396566
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGGA ACCTTCTCAC CGTCACTGAG ATCAAGAATT CCCCGAAGCC GAAACTTCGG 
GACGGAGATG GCTTGTGGCT GCACACCAGT AGCTCCGGAA ACCGCCATTT TGTGTTCATC 
TATATAAGGC ATGGGCGTCG CCGCGAAATG GGCCTAGGCA CATATGGAAC TGGAACCGGC 
CAGGTTAGTC TCGCAGCCGC CCGAACAAAA GCGGAGGAGA TACGAACCAT CCTCGGGCGC 
GGAGGCGACC CATTCACCGA GATGGGGGAG CGCCAAGAAA AGGTGAAGCC CACAACTTTC 
GGACAATGCG CCGATGATCT CGTTGACGCC ATGGAATCGC AATGGCGAAA TGAAAAGCAC 
CGCGCGCAGT GGCGAATGAC GCTGACCGAA TACGCGAAGG CGATTCGAAA GCTACCCGTT 
GCGGAGGTGA CGACCGATGA CGTTGTTCGT GTTCTGAAGC CAATATGGAG CACAAAGGCG 
GAGACGGCAT CTCGTCTTCG CGGTCGAATT GAAAAGGTGC TCGACCACGC GAAAGTCCGC 
GGCCTGCGAA CTGGAGAGAA CCCAGCTCGA TGGAAAGGAC ACCTCGACCA TATCCTGCCA 
AAGGCCGGGA AGCTGAAGCG AGGACATCAC GCCGCGATGC CGTATGCGGA CGTGCCGGCC 
TTCATTAAGA AGATTCGAGA GGCGTCCGGA GTTGGCGCCC GCGCGCTCGA GTTCACTATT 
CTGACTGCGT CACGTACGGG CGAAACCATG GGAGCCAAGT GGGCTGAATT CGACTTCAGG 
GAAAACGTAT GGACCGTACC CGCCGAGCGG ATGAAGGGGG GACGCGAACA TCGGGTTCCC 
TTGACCGACC GAGTTCTGGC CGTACTTACC GAGATGAAGA AGCGATCGGT CAATGACTTC 
GTGTTCCCCG GTTCGAAAGC AAACACGCCG ATTAGCAACA TGACGATGAC CAAGGTTATG 
AAAACGTATG AGGCAGACGC CTTTACCGTG CATGGTTTTA GGTCAGCCTT CCGGGACTGG 
GCATCCGAGG AGACCGAATT CCAGGGCGAG GTCGCCGAGG CCGCATTGGC TCATATTACA 
GGCGACGAGA CCGAGCGCGC CTATCGCCGC GGCGATGTTC TGGAAAAGCG TCGGAAACTG 
ATGGAGGCGT GGGAGACGTA CTGCGAAGTA GTGTAA

Protein sequence

MARNLLTVTE IKNSPKPKLR DGDGLWLHTS SSGNRHFVFI YIRHGRRREM GLGTYGTGTG 
QVSLAAARTK AEEIRTILGR GGDPFTEMGE RQEKVKPTTF GQCADDLVDA MESQWRNEKH 
RAQWRMTLTE YAKAIRKLPV AEVTTDDVVR VLKPIWSTKA ETASRLRGRI EKVLDHAKVR 
GLRTGENPAR WKGHLDHILP KAGKLKRGHH AAMPYADVPA FIKKIREASG VGARALEFTI 
LTASRTGETM GAKWAEFDFR ENVWTVPAER MKGGREHRVP LTDRVLAVLT EMKKRSVNDF 
VFPGSKANTP ISNMTMTKVM KTYEADAFTV HGFRSAFRDW ASEETEFQGE VAEAALAHIT 
GDETERAYRR GDVLEKRRKL MEAWETYCEV V