Gene Smed_5089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5089
Symbol
ID	5319391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	37849
End bp	39204
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	63%
IMG OID	640776868
Product	aminotransferase class-III
Protein accession	YP_001313800
Protein GI	150377205
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.447769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACA ATCAGGATCC CGCCTTCTGG GCGGCCGCGG GCAGGCATCT GATCCGCTAT 
GGCGGAAGCT TCGACCCCGC GATCATCGAG CGGGCCAGGG GCTCTTTCGT TTTTGATGCC 
GACGACCGGC CGATACTCGA CTTCACCTCG GGCCAGATGA GTGCACTGGT CGGCCATTCC 
CATCCCCGGA TCGTCGCGAC CGTTCAGCGG CAGATGGAAA AGGTCGCCCA TCTTTTCAGC 
GGAATGCTGT CGCGACCGGT CGTCGATCTC GCCGAGCGGC TGGCGGCGCT GGCACCCGGT 
CTCGACAGGG TCATGCTGTT GTCGACCGGG GCGGAATCCA ACGAGGCGGC CATCCGCATG 
GCCAAGCTCG TCACCGGCAG GCACGAAATC GTCGCATTCT CAAAGAGCTG GCACGGCATG 
ACCGGCGCGG CGAGTTCGGC AACATACAGC GCCGGCCGCA AGGGTTATGG CCCGGCCATG 
GTCGGTTCTC TGACCATTCC GGCACCCAAC ACATTCCGCC CGCGTTTTCG GCATGGCGAC 
GGGAGCCTGG ACTGGAGGAC GGAGCTGGAC GATGCTTTCG CGCTGATCGA CAGTCAGTCG 
ACCGGCAGCC TCGCCGCCTT CATCGCCGAG CCCATCCTGT CGAGCGGCGG ATTGCTCGAA 
CTGCCGCAGG GCTATCTCGC AGCGCTCATG GAAAAATGCC GCGAGCGCGG AATGCTGCTC 
ATTCTGGACG AGGCGCAAAC CGGAATCGGC CGGACTGGAA CCATGTTCGC GTTCCAGCGC 
GACGGCGTTA CGCCCGATAT TCTGACGCTC TCGAAAACGA TCGGCGCCGG CCTGCCACTC 
TCCGCCGTCA TGACAACGAC GGAGATCGAG GAGGCGGCGC ATGAGAAGGG CTTCCTTTTC 
TACACCACGC ATGTCTCCGA TCCCCTGCCG GCCGCGGTGG GCCTTGCCGT GCTCGACGTC 
GTCGCCGAGG AAGGGCTTGT CGAGCGCGCC CGTCATATCG GCGGCGAGCT CTTCGATGGC 
CTGTCGCAGT TGAAGCAGAG ATTCGACTGC GTCGGCGACG TACGCGGTCG CGGCCTTATG 
CTCGGCGTCG AAATCGTGAA ACCGGGTGAG AGCAGAAGTG CCGATCATGA GCTTGGCAGC 
CGGATTGCCG CCGAAGCTTT CCGCCGTGGG CTCAGTATGA ATATCGTTAA GCTTCCCGGT 
ATGGGCGGCG TCTTCCGCAT CGCGCCGCCA TTGACGATTT CCGAGGAGGA GATCGAGCTT 
GGCCTGCGCA TCATCACGCA ATCCATCGAA GCATCATTGG CCATCGAAGC GGCATTGCCG 
CTCGGCGCAA GCCGTCAGGA CGTTGCGGCA GAATAG

Protein sequence

MSNNQDPAFW AAAGRHLIRY GGSFDPAIIE RARGSFVFDA DDRPILDFTS GQMSALVGHS 
HPRIVATVQR QMEKVAHLFS GMLSRPVVDL AERLAALAPG LDRVMLLSTG AESNEAAIRM 
AKLVTGRHEI VAFSKSWHGM TGAASSATYS AGRKGYGPAM VGSLTIPAPN TFRPRFRHGD 
GSLDWRTELD DAFALIDSQS TGSLAAFIAE PILSSGGLLE LPQGYLAALM EKCRERGMLL 
ILDEAQTGIG RTGTMFAFQR DGVTPDILTL SKTIGAGLPL SAVMTTTEIE EAAHEKGFLF 
YTTHVSDPLP AAVGLAVLDV VAEEGLVERA RHIGGELFDG LSQLKQRFDC VGDVRGRGLM 
LGVEIVKPGE SRSADHELGS RIAAEAFRRG LSMNIVKLPG MGGVFRIAPP LTISEEEIEL 
GLRIITQSIE ASLAIEAALP LGASRQDVAA E