Gene Smed_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1744
Symbol
ID	5322602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1823835
End bp	1824836
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	64%
IMG OID	640790682
Product	aminotransferase class I and II
Protein accession	YP_001327414
Protein GI	150396947
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01140] L-threonine-O-3-phosphate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.57305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.193551
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATC CGATCACCCA TGGCGGCGGA ATCTCGGAAG CTGCAGCGCG CTTCGGCGGC 
AGGCCGGAGG ACTGGCTTGA CCTCTCGACG GGCATCAATC CCTGTCCCGC GGCGCTGCCG 
GAGATCGATG CCCGGGCCTG GCATCGGCTG CCGGACCGGC ATGTGGAAGA GGCAGCGCGC 
GCGGCGGCCA GCCGCTATTA CCGGACCGGC GGGCTGATGC CCTTGCCGGT GCCGGGAACG 
CAGGCGGTCA TTCAGTTGCT TCCGCGGATC GCGGATCCGG GGAAGAGGGC AGCCATCTTC 
GCTCCAACCT ATGGGGAGTA TGCACGCGTT CTGAGAGCCG CCGGCATTGC CGTCGATACT 
GTCGGATACG CCGATGATCT TCAGGCAGCG CACGGACTTT CCGTCATCGT CAATCCCAAC 
AATCCGACGG GTCGTTTTTT TCCGCCGGAT GAAATTCTTG CGATGGCGGA GGCGATGAGA 
ACTCATCGCG GACTCCTCGT GGTGGACGAA GCTTTCGGCG ATCTGGAGCC GGCGGCAAGC 
GTGGCCGGAC ATGTAGCGGC TCATGACAAT CTTATCGTTT TCCGCTCCTT CGGTAAGTTC 
TTCGGTCTTG CGGGGCTTCG CCTCGGCTTT GTGGTCGCGA ACCGCCCGAT CGAGGAAGCG 
CTCCGCAACT GGCTCGGCCC ATGGGCGGTC TCGGGGCCGG CACTCGCCAT CTCGGCGAAG 
CTGATGGAGG GTGATACGAA CCGGATCAAA GCCGGTATCG CGGAGCGCAA AGCTGCGCTC 
GACGCCCTGC TTTTTGGCGC GGGCCTTCAC ATCGTCGGCG GCACCGGCCT CTTCGCACTC 
GTCGATCACG AGCGGGCGCA CGATATTCAT ACCGCACTCT GCGAGGCGCA CATCCTGACG 
CGCAAATTCG ACTATGCTCC GCGCTGGCTG CGAATCGGGC TGTCACCGAA CCCGGCAAGC 
GACCGCCGGC TCGCAGAGGC GTTTAATCGA ATGGGTTTTT AA

Protein sequence

MPNPITHGGG ISEAAARFGG RPEDWLDLST GINPCPAALP EIDARAWHRL PDRHVEEAAR 
AAASRYYRTG GLMPLPVPGT QAVIQLLPRI ADPGKRAAIF APTYGEYARV LRAAGIAVDT 
VGYADDLQAA HGLSVIVNPN NPTGRFFPPD EILAMAEAMR THRGLLVVDE AFGDLEPAAS 
VAGHVAAHDN LIVFRSFGKF FGLAGLRLGF VVANRPIEEA LRNWLGPWAV SGPALAISAK 
LMEGDTNRIK AGIAERKAAL DALLFGAGLH IVGGTGLFAL VDHERAHDIH TALCEAHILT 
RKFDYAPRWL RIGLSPNPAS DRRLAEAFNR MGF