Gene Smed_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1658
Symbol
ID	5322516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1747412
End bp	1749136
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	66%
IMG OID	640790598
Product	lambda family phage portal protein
Protein accession	YP_001327330
Protein GI	150396863
COG category	[R] General function prediction only
COG ID	[COG5511] Bacteriophage capsid protein
TIGRFAM ID	[TIGR01539] phage portal protein, lambda family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0805551
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.257873
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG ACGTCACGAT CCTCGGCCCC GATGCGAAGC CGCTTTCGCC GGCAGTTCGT 
GCCGCTGCCC GCGTGCAGGT TGCGAGAAAC CGGCTGATGG CGTCTTCGGC CTACCAAGGT 
GCATCCTACG ATCACCCGTC CTTCGCCAAA TGGCGGCCGG GCACCTGGTC CGGGCAGTCG 
GCGCTGACCT GGTCGCGCTC CGAGCTGGTC GACCGGCTGA ACGACGTGGC GCGCAATGAC 
GGCTGGGGTG CCGCCGGCAC CTCGCGCCTC GTCGACAACA TCATCGGCTC GGGCTGGACG 
CTTGCGGCGC GGCCGAACCA CGTCTCGCTC AACATGACCT TTGAGCAGGC GGAGGAGATC 
GCCGACAAGA TCGAGGCCCT GTGGCGCGAT TACACGCAGG ACGTCGACAA ATGGTGCGAC 
GCCGAGCGGA CGAAAACCAT GGCCGGCGTT CTCGGCCTTG CTGCCCGTCA GCGGTTTGGT 
CCCGAGGGCG AGGCCTTCGG CGTCATCGTC TGGCAGGACA ATGCACCGTT GTTCCAGACG 
GCAATCCATG TCGTCGATCC GGCCCGGTGT TCAAACCCGA ACGGGCGCAT GGACGAGGAG 
TTCCTGCGCG ACGGCGTTGC CATCGACGGA TACGGCGCAC CGGTCGGCTA CCACTTCCGC 
AAGTCGCATC CCGGCGAGTT CTTCGCCGGC AATACCGGCC TGTGGCATTG GGAGTATGTC 
GATCGGGAGA CCGAATGGGG GCGCCCGATC GTCGTTCACG CCTACGAGCA GAAGCGCGCC 
GGCATGACGC GCGGCGTTTC CGACTGGGCT CCGGTCATGC GGTCGATCAA GCAGTCGACC 
GACTACGAGG ACTATGAGAG CCAGGCGGCA ATGCTGAACG CTGTCATGGC TGCCTTCATC 
GAAACCCCCT TCGATCCGGA AGAGATGCTC GAGGCGATCG GCGCGGATTA CGGCAATGAC 
GGCATCGCCA AGCTCTTCGG CGAAATGTCG GCCGCGCAGA AGGCCTATTA CGGCGCCGCA 
CCGATCGATT TGCCCGGCGT TCGTATCAAC ACGCTGCAGC CCGGCGAAAA GGCGACGCTG 
ACCAAGCCGG AGCACCCGAA CGCCAATTTC GAGGCCTTCG TCAATGCGGC GCTGCGCAAG 
GTCGCGAGTG CGATCGGCGT CACCTACGAG CAGCTCACCA TGGACTGGAG CCAGGTGAAC 
TATTCGTCGG CGCGCGCGGC ACTCCTCGAG ATCTGGCGCG GCTTCACCGC CAAGAAGGGC 
GGCTTCGCCT CGCAGTTCAT GGCACCGATC TATCGGGCAT GGCTCGAGGA GGTGTTCGAC 
AAGGGCCTGA TCGAGCTCCC GGCGGGAGCC GTTCCTTTCG AGCTGAACCC GGCAGCATGG 
TGCCATGCGG ACTGGATCGG CCCCGGCCGC GGCTGGATCG ATCCGCTGCG CGAGGCGCAG 
GCTGCCAGCG AGCGGCTCGC CGGCAATCTG ACCACGCTCC AGCAGGAAGC GGCCGAGCAG 
GGGCGGGACT GGAAGATGGA TGCGCAGCAG CGCGCCCGGG AACGGGCCTT CTACGAACGG 
CTCGGGCTCG ATCCAGATCC TGGCAAGCCC GAAGCCAGAT CGCAGGCGAG TGCCGCTCCG 
CCAGCCGAGC CCGGCGACGA GGCCGAGGAA GAGGTCAACG GACGGACCTC GGCGCGGCGC 
CATCCTGCCG GCATCCCGAG GATTGCCAGA AGGAAAACGG CATGA

Protein sequence

MSGDVTILGP DAKPLSPAVR AAARVQVARN RLMASSAYQG ASYDHPSFAK WRPGTWSGQS 
ALTWSRSELV DRLNDVARND GWGAAGTSRL VDNIIGSGWT LAARPNHVSL NMTFEQAEEI 
ADKIEALWRD YTQDVDKWCD AERTKTMAGV LGLAARQRFG PEGEAFGVIV WQDNAPLFQT 
AIHVVDPARC SNPNGRMDEE FLRDGVAIDG YGAPVGYHFR KSHPGEFFAG NTGLWHWEYV 
DRETEWGRPI VVHAYEQKRA GMTRGVSDWA PVMRSIKQST DYEDYESQAA MLNAVMAAFI 
ETPFDPEEML EAIGADYGND GIAKLFGEMS AAQKAYYGAA PIDLPGVRIN TLQPGEKATL 
TKPEHPNANF EAFVNAALRK VASAIGVTYE QLTMDWSQVN YSSARAALLE IWRGFTAKKG 
GFASQFMAPI YRAWLEEVFD KGLIELPAGA VPFELNPAAW CHADWIGPGR GWIDPLREAQ 
AASERLAGNL TTLQQEAAEQ GRDWKMDAQQ RARERAFYER LGLDPDPGKP EARSQASAAP 
PAEPGDEAEE EVNGRTSARR HPAGIPRIAR RKTA