Gene Smed_1660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1660
Symbol
ID	5322518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1749380
End bp	1751422
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	65%
IMG OID	640790600
Product	phage terminase GpA
Protein accession	YP_001327332
Protein GI	150396865
COG category	[R] General function prediction only
COG ID	[COG5525] Bacteriophage tail assembly protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.284129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGC TGTTCAATCC CGAGCGGCTC GCTCTCAGCG TGCTTGCCGA GATCTGCGAA 
CCGCCGCCGG CAGTCGATTA TCTCGACTGG GCGAAGCGGA ACATCGTGTT CTCGGAACGC 
ATCACGGACC ATCCGGGGCC GTACAACGAA GACCTGGTGC CGTTCTTCTC GGAGATCCTG 
CGAGCGTTGT CGCCGGAAGA TCCGTGCAAC ATCGTCAGCC TGGCGAAGTC GGCGCAGATC 
GGCGGTACCA TCTGCGCCAA CATCTTCACG CTCGGCTCGC TCGACATGGC GCCCGGCGAT 
TTCCTCTATG TCCACCCGAC CGAGGAGAAC GCCGCCCGCT GGTCGAAGAC GAAGCTGATG 
CCGCTGGTGC GCGAGATGCC GGCGGTCGCC AAGCTGTTCT CGCAAAACAG CCGCGATGCG 
AGCAACTCGG TGCTCTACAA GGAACGCGTC GACGGGCGCG GCGCCATCCA GGCGGCCGGC 
GCCAACTCGC CGGCAGGCCT GTCGATGATC TCGCCGCGAA AGCAGGTCCA GGACGATCTT 
GCCAAGTGGC AAATGAACGA GGCTGGTGAT CCGGAGGTGC AGGCGGACAG CCGCAGCAAG 
GCGTTCTTCA ACGGCAAGAT CTTCAAGATC TCGACGCCGA TGGTATCGCC GGGCTGCAAG 
ATCACGTCGA ACTATCAGGA AGGGACGCAG GAGACCTACC ATGTCCCCTG TCCGCACTGC 
CAAGAGCTGC AGGAGCTGCG CTGGGAGAAC ATGCGGGATC ACATCGATCC CGAGCATCCC 
GAGCAGGCGC ATTTCGTCTG CATCCATTGC GGCTGCGAGA TCCACGAGCA CCATCGCGAA 
TGGATGGTGA AGCCGGAAAA CGGCGCGAAG TGGGTTGCCA AATATCCGGA GCGCGGCCGC 
CGCCATCGAT CGTTCCGCAT CTGGATGGCC TATTCGCCTT TCGAGCGCTG GGAGAACCTG 
GCGCGCGAGT GGCTGACGGT CCAGGCCGGT GGCCCGGAGA ACCGGGAAAA GGGTTCTGGC 
GCCGAGCAGA CGTTCTGGAA TGACTGGCTC GGGCTCGCCT TCGAGGCGGA CAACAAGGCG 
ATCGACTGGG AAGTGCTCCG CGATCGCGCC GAGGACCACG GTTTCCAGCG CGGTGTCATC 
CCGGCCGAGG CGCTGGCGCT GGTGCTCGGC ATGGACGTGC AGGGCGACCG CGTCGAGTGG 
CTGCTGGTCG GCTACGGCAG GAATCGGTAC CGGGCCGTCA TCGACCACGG CGTCGTCGAC 
CATCGCGCCG GCAGCCACCT GGCGGACGCC AAGGAACATT CCGGCCATAT CTCCGAGCCG 
GAGGTTCGCA CCGCCCTCGA TCGGCTGCTG CAGCGCGAAT GGCTCGACGA TGCCGGCCGC 
AAGCGAACCG CCGACCGCGT CGCCATCGAC GGCAACGCCT ATACCGACGA CGTCTGGAAC 
TGGGTTCGCA AGCATCCGAA GTCGCGCGTC ATCATGGTGC GCGGCGGCAA TACGGAAGCC 
GCGCCGCCGA TCGTGCAGAC GAAAGAGTAT GACCGGAAGG GCAAGCCGAA GAAGCAGAAG 
TGGTCCTCCC GCTTCTTCAC CTTCAACGCC TCGGCCTTCA AGATCCGGCT CTACCGGGAC 
TACAAGAAAG ACGATCCGGA GCAGGCGGGC TATATCCGTT TCGCCCGCGG CTTCGGCGAC 
GATTTCTACC AGCAGGCGAC ATCGGAAGCC CGGGTACCGG AGAAGACCCG GAGCGGTCAC 
ACCCGCTACG TCTGGAAACT CGGCGAGGGC AAGCGCAACG AAATCATCGA CATGCTCAAC 
CAGAGCCTGG CCGGTGCCTA TCGCTGGGGC GTGCCCTACT GGACCGACGA GGAATGGGAC 
GCGATCGCCG ATCGCCTCGG CCGCCTCGAA GCGCCGCAAC AGGGCGATCT CGAGGATCAT 
CTGAACCAGA TCGCCGTCAA GACCGAACCT GCCGCAGGCC AAAGCGCCGC GGCAGAACAG 
CAATCGCCGC TCGTCGCCGC CGCCCTCGCG CGCGCCGCCC GGGCAGCGCA GCGAAACCGC 
TAG

Protein sequence

MTVLFNPERL ALSVLAEICE PPPAVDYLDW AKRNIVFSER ITDHPGPYNE DLVPFFSEIL 
RALSPEDPCN IVSLAKSAQI GGTICANIFT LGSLDMAPGD FLYVHPTEEN AARWSKTKLM 
PLVREMPAVA KLFSQNSRDA SNSVLYKERV DGRGAIQAAG ANSPAGLSMI SPRKQVQDDL 
AKWQMNEAGD PEVQADSRSK AFFNGKIFKI STPMVSPGCK ITSNYQEGTQ ETYHVPCPHC 
QELQELRWEN MRDHIDPEHP EQAHFVCIHC GCEIHEHHRE WMVKPENGAK WVAKYPERGR 
RHRSFRIWMA YSPFERWENL AREWLTVQAG GPENREKGSG AEQTFWNDWL GLAFEADNKA 
IDWEVLRDRA EDHGFQRGVI PAEALALVLG MDVQGDRVEW LLVGYGRNRY RAVIDHGVVD 
HRAGSHLADA KEHSGHISEP EVRTALDRLL QREWLDDAGR KRTADRVAID GNAYTDDVWN 
WVRKHPKSRV IMVRGGNTEA APPIVQTKEY DRKGKPKKQK WSSRFFTFNA SAFKIRLYRD 
YKKDDPEQAG YIRFARGFGD DFYQQATSEA RVPEKTRSGH TRYVWKLGEG KRNEIIDMLN 
QSLAGAYRWG VPYWTDEEWD AIADRLGRLE APQQGDLEDH LNQIAVKTEP AAGQSAAAEQ 
QSPLVAAALA RAARAAQRNR