Gene Smed_4720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4720
Symbol
ID	5318900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1243283
End bp	1244467
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	63%
IMG OID	640776518
Product	hypothetical protein
Protein accession	YP_001313450
Protein GI	150376854
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00560129
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCTGGC TCATGTCGGG CTCTAGAGCA ATTCCAGGAA AAGTGCGCAG CGGTTTTCCG 
TCCGGAATTG CGCAGAAACA TAGGGCTGGA GCACTTCTCC TTACCGCGTT GCTGGCGCTC 
ACGGCACCGG CGCATGCCGG CGAAGTGCCG GCGGTTCGTA TCGGAATCAA CCGGATGAAT 
CTCGCCTGGC TGCCCCGCAG CGAACAGGAG AAGGTTTTGA AGGACATCGC CATGAGCGGC 
GCCACTGATA TCCGCCTTTC GCTTTCGCGT CCGATCGACG AGAGCATTGA GGCGCTGGCG 
ATCGCTCACC GGCTGGGCCT GCGTATCCTT CTGGAAATCC AGCTGGGCAA CAAAAGCTAC 
TATCCGCAGA GCGCAGGTCC GAGAACGGGC CATGGCCGCA TCTGGGATGT CTATCGATTA 
TCGGATCTTG ATCTCGCGCG ATACCGCAGG GAACTGCATG ATGCGCTTCG GCGTATCGAC 
GCCCTGGGAA TTCGTCTCGA AGCGATCGAG CCCGGGAACG AGATCAACTA CGCCGGATAT 
AACGGCGACC TTGCCGTTTT TCGCAAACCG GGCACCCGGA CCCCGCGCAG CCTCGGCGAA 
CTTCAGGACC GGGCTGGCTT CGAGCGCGGC CTCGACAATT ACGTGCAGGC GGTCGCGATC 
ACCCGATCGG AGGTGCGCCG GACCACGCAT AGCCGCGATG CAGCCGTCAT TTCCGCTGGC 
CTCTCGGATA TGAGTGCCGC TGAGGCCGAC AGGCGCGGGA TGGAAAGGCT CGATCCCCAC 
CAACTCGTCG CGCTTCTTCA AGAGCGTGGC ATCGATAGCC TGGTGGATGC CTATGGCATC 
CACATCTACC CCGGCAGGAA AGCGGCGCCT GCCATCGCCG CGCGCGTCAG AAGCCTCCTT 
GAGTTCTGCC AACCGGCGGC CACGGGCAGG TCCTGCTGGG TCACCGAATG GGGGATCGCA 
AATACGGCGC GCTCGTGCCC CGTGGATGAT CGATCGCGAG GAAAGGCGAT CGGCGCCACG 
CGCGCTGCTT TCGGCGAATT TATCGAGGCA GGCCGGCTGA CGGCTGCCTA CTATTACGAC 
TGGGACAGCG AGCCTTCCTA TAGTCTCTGG CGCTGCGGCA AGCTCAGCCC GGACGCGGCC 
ACCGCACTCA GCCCGCTCGA GTCTGCCGGA GCGCGAGCAC GATGA

Protein sequence

MLWLMSGSRA IPGKVRSGFP SGIAQKHRAG ALLLTALLAL TAPAHAGEVP AVRIGINRMN 
LAWLPRSEQE KVLKDIAMSG ATDIRLSLSR PIDESIEALA IAHRLGLRIL LEIQLGNKSY 
YPQSAGPRTG HGRIWDVYRL SDLDLARYRR ELHDALRRID ALGIRLEAIE PGNEINYAGY 
NGDLAVFRKP GTRTPRSLGE LQDRAGFERG LDNYVQAVAI TRSEVRRTTH SRDAAVISAG 
LSDMSAAEAD RRGMERLDPH QLVALLQERG IDSLVDAYGI HIYPGRKAAP AIAARVRSLL 
EFCQPAATGR SCWVTEWGIA NTARSCPVDD RSRGKAIGAT RAAFGEFIEA GRLTAAYYYD 
WDSEPSYSLW RCGKLSPDAA TALSPLESAG ARAR