Gene Smed_4336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4336
Symbol
ID	5318094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	834375
End bp	835922
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	63%
IMG OID	640776141
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001313074
Protein GI	150376478
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01733] amino acid adenylation domain

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0623029
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00463044
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGTTCG AGCAATTCCT CATCAGGAAC GCCGCGGCGA ACGGGGCAAA AACGGCGCTG 
GTCACCGATC GCCGGCGGCT CAGCTATGCC GAACTGGACG ATCTTTCAAC GCGTCTCGCG 
GCTGCTCTTG CCGCAAACGG CGTGAAGCGG AACGATCGCG TTCTGGCGTT CATGGATAAT 
TGCTGGGAGG CGGCGGTCGC AATCTTCGCG ATCCTCAAGG CCGGAGCCAC CTTCAGTCCG 
ATCAACGCTT CGACCAAAGC AGACAAGCTT GCCTACGTAA TCGCGGATTG CGAGGCGGCG 
GCAATCCTGA CGCAGGCGAA ACTGATGCCG GTCGTTACCG AGGCGCTTGC GCTTGCTCCC 
GGTTATCGGC CTTTCATTGC CTCGGCCGCG GCGCCAGGCG GGCGCATGCC CGACGGTGCC 
GCTTCCTTCG AGGAATGCCT GACAGCCGTA CCCGCCGCTG TTTCGCACGG GGGTATCGAC 
ATCGATCTCG GCATGCTGAT TTATACCTCG GGGTCGACGG GACGTCCCAA GGGCGTGATG 
ATGACGCATC GCAACATCGA CGCTGCCTCA GAATCGATCA CTACCTATCT CCGCAACACG 
CCTGAAGACA TCATTCTGAA CGTACTGCCG CTCGCTTTCG ACTATGGTCT TTACCAGTTG 
CTGATGGCGG TCCGGCTCGG CGCGACGCTC GTGCTCGAAA AATCATTCGC CTTCCCGCAG 
GCGATTTTCG ACCGGATTCG GGCCGAGGGT GTCACCGGCT TCCCACTCGT GCCGACCATG 
GCGGCGATGA TCCTTCAGAT GCGCGATCTC GAGCCCGGCT TCCTGCCAAG CCTTCGCTAT 
CTCTCCAACA CCGCGGCAGC TCTCCCGCCG GCCCATATTG CGCGCCTGAG GGAGCTTTTT 
CCCGGCGCCC GGCTCTATTC CATGTACGGC CTGACGGAGT GCAAGCGCTG CACCTATCTG 
CCGCCGGAGG AGCTGGATCG CCGGCCGGGT TCCGTGGGGA TCGCGATACC GAACACGGAA 
GCCTTCGTGG TCGATGACGA GGGAAACCGG CTACCGCCCG GTGTGCCTGG TGAACTGGTT 
ATCCGCGGCC CGCATGTGAT GCAGGGCTAT TGGCGCAACG CTGCCGCGAC CGAGCGCATG 
CTGCGCTCCG GTCCTGATCC GTGGGAAAGG GTGCTTTATA CCGGCGATCT CTTCCGCACC 
GACGAGGAGG GCTTCCTCTA CTTCGTCGGC CGCAAGGACG ACATCATCAA GACCCGCGGC 
GAAAAGGTGG CTCCCAAGGA GGTCGAGACC GTGCTGCACG CTCATCCGGG CGTAGCCGAA 
GCCGTGGTCA TCGGCGTGCC GGATCCGGTG CTCGGTGCTG CGATCGGCGC GCTCGTCGTG 
CTGTCGGACC CGTCTGTGAC CGAGAGGGAG ATTATCCGCC ACTGCGCCCG CCATCTCGAG 
GATTTCATGG TGCCGAAAAT CGTCGAGTTC CGGGCTGAAC TGCCGAAGAC CGATACCGGA 
AAAGTCAGCC GCCGCCTCGC GGCCGAAACA TTGGAGCCAG CAGAATGA

Protein sequence

MRFEQFLIRN AAANGAKTAL VTDRRRLSYA ELDDLSTRLA AALAANGVKR NDRVLAFMDN 
CWEAAVAIFA ILKAGATFSP INASTKADKL AYVIADCEAA AILTQAKLMP VVTEALALAP 
GYRPFIASAA APGGRMPDGA ASFEECLTAV PAAVSHGGID IDLGMLIYTS GSTGRPKGVM 
MTHRNIDAAS ESITTYLRNT PEDIILNVLP LAFDYGLYQL LMAVRLGATL VLEKSFAFPQ 
AIFDRIRAEG VTGFPLVPTM AAMILQMRDL EPGFLPSLRY LSNTAAALPP AHIARLRELF 
PGARLYSMYG LTECKRCTYL PPEELDRRPG SVGIAIPNTE AFVVDDEGNR LPPGVPGELV 
IRGPHVMQGY WRNAAATERM LRSGPDPWER VLYTGDLFRT DEEGFLYFVG RKDDIIKTRG 
EKVAPKEVET VLHAHPGVAE AVVIGVPDPV LGAAIGALVV LSDPSVTERE IIRHCARHLE 
DFMVPKIVEF RAELPKTDTG KVSRRLAAET LEPAE