Gene Smed_1363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1363
Symbol
ID	5322214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1444310
End bp	1445350
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	61%
IMG OID	640790306
Product	cysteine synthase A
Protein accession	YP_001327046
Protein GI	150396579
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGTTC TTCCGTCCGT GCTCGAAGCA ATCGGCAATA CGCCGCTGAT CCGGCTCAAG 
GCCGTGTCCG AAGCGACCGG CTGCAACATC CTCGGCAAAG CGGAGTTTCT CAACCCTGGG 
CAGTCGGTAA AGGATAGGGC GGCGCTCTGG ATCATCCGCC AGGCTGAAAA GGCCGGCCAA 
TTGCGACCGG GCGGTGTGAT CGTCGAAGGC ACCGCGGGCA ATACCGGCAT TGGCCTTGCC 
GTTGTCGCCA GCGCGCTCGG ATACCGCACC GTCATCGTTA TCCCCGAGAC ACAGAGCCAG 
GAGAAGAAGG ACGCACTGCG CCTGCTTGGC GCCGAGCTGG TCGAAGTTCC GGCGGTACCG 
TACAGGAATC CGAATAATTA CGTGAAGATC TCCGGCCGTC TGGCCGCCCG ACTTGCCGAA 
ACCGAGCCGA ATGGCGCGAT CTGGGCAAAC CAGTTCGACA ATGTCGCCAA TCGGCAGGCC 
CATATCGACA CGACCGCGCC CGAGATATGG CGCGACACCG ATGGAAAGGT CGACGGGTTC 
ATTTGCGCCG TCGGCTCCGG CGGCACTCTT GCCGGTGTGG CGGAAGGCTT GCGCGCCCGC 
AAGGCGGGGA TCAAGATCGG CATCGCCGAT CCGGAAGGCG CGGCACTCTA CAATTTCTAT 
GCCCATGGCG AGCTCAAGTC GAGTGGAAGC TCGATCACCG AAGGAATCGG TCAGGGGCGA 
ATCACCGCCA ATCTCGAAGG TTTCACGCCG GACTTCGCCT ACCAGATTCC AGACGCCGAG 
GCGGTTCCCT ACGTCTTCGA GCTCATTGAA AAAGAAGGCA TCTGCATCGG CGGATCGACC 
GGCATCAACG TCGCCGGAGC CGTGCGGCTT GCTCGTGAGC TCGGTCCGGG ACACACGATC 
GTGACGATCC TCTGTGACTA TGGTAACCGC TATCAGTCGA AGCTCTTCAA TCCGGACTTC 
CTGGCCTCCA AGGGTCTGCC TGTCCCGGCC TGGCTGAAGA CGGCTTCGAA CATTGCAGTG 
CCATACGAAC CCGCTGGATA G

Protein sequence

MPVLPSVLEA IGNTPLIRLK AVSEATGCNI LGKAEFLNPG QSVKDRAALW IIRQAEKAGQ 
LRPGGVIVEG TAGNTGIGLA VVASALGYRT VIVIPETQSQ EKKDALRLLG AELVEVPAVP 
YRNPNNYVKI SGRLAARLAE TEPNGAIWAN QFDNVANRQA HIDTTAPEIW RDTDGKVDGF 
ICAVGSGGTL AGVAEGLRAR KAGIKIGIAD PEGAALYNFY AHGELKSSGS SITEGIGQGR 
ITANLEGFTP DFAYQIPDAE AVPYVFELIE KEGICIGGST GINVAGAVRL ARELGPGHTI 
VTILCDYGNR YQSKLFNPDF LASKGLPVPA WLKTASNIAV PYEPAG