Gene Avin_42390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_42390
Symbol	otsA
ID	7763115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4266209
End bp	4267612
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	66%
IMG OID	643807090
Product	alpha,alpha-trehalose-phosphate synthase (UDP-forming)
Protein accession	YP_002801338
Protein GI	226946265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGTC TAGTCGTGAT TTCCAATCGG GTCGCTCCCA TCCGCGAAGG CAAGATCGCT 
GCCGGGGGAT TGGCCGTGGG CGTGTACGAT GCGTTGCGGC AGAATGGCGG CATCTGGTTC 
GGCTGGAACG GCGAGGTCGG ACAGAAGCCG GAAACTGCCT GCGAGAGCGC CGGCAATATC 
ACCTACGTCA CCCTGGGCCT CAGCAAGCCG GACTACAACG AATACTACCG CGGCTTCTCC 
AACGCCACGC TCTGGCCGAT CTTCCACTAC CGCATCGATC TGGCGCGCTA CAGCCGCGAG 
GAGTACCTGG GCTACCGGCG GGTCAACGCC ATGCTGGCGG AGAAGCTCAA GCCCCTGCTG 
CGTCCCGACG ATATCCTCTG GGTCCACGAT TACCACCTGA TTCCCTTCGC CGCCGCCTGT 
CGCCAACTGG GAATCGGCAA CCGCATCGGC TTCTTCCTGC ACATTCCCTT CCCGACGACG 
GAGGTCCTCA CCGCGGTGCC CCCGCACAGG GACCTGTTCC AGACCCTCTG CGACTACGAC 
CTGGTCGGCT TCCAGACCGA GAGCGACCGC ATGGCCTTTC AGGACTACGT CTGCCGCGAA 
CTCGACGGGC TCATCGGCAC CGACGGCAGC CTGACCGCCT GCGGGCGGAA CTTCCGCGCC 
GGCGTCTATC CCATCGGCGT CATGCCCGAC GATATCCGCC GTTTGGCCGA CTCCTACCGG 
GGCCGTCGCC CCATGATCGG GCGGACCGCC GAAGGCAAGC TGCGCAAGAC CCTCATCAGC 
GTCGACCGGC TGGACTACTC CAAGGGGCTG GTGGAACGCT TCCTGGCCTA CGAGCAGTTC 
CTCGAACATT ACCCCGAGCA CCGGCGCAAC GTGGAACTCA TCCAGATCGC GCCGACCTCG 
CGCACCGACG TGAAGACCTA CCGGGCCATC CGCAAGCAAC TGGAAACCGT GGCCGGGCAT 
GTCAACGGAC GTCTGGCCGA TCTCGACTGG ATGCCGCTGC ACTATCTCAA CAAGAGCCTC 
GAGCGGCGCA CCCTGATGGG CCTGTTCCGC ACCGCCAACG TCGGCCTGGT CACTCCGCTG 
CGCGACGGCA TGAACCTGGT GGCCAAGGAA TACGTCGCCG CGCAGAATCC GGCCGATCCG 
GGCGTGCTGG TGCTGTCGCG CTTCGCCGGC GCGGCCCACG AGCTGGGCGC GGCGCTGATC 
GTCAACCCCT ACGACTGCCT GGGCATGGCC GAGGCCATGG ACCGCGCCCT GCGCATGCCG 
CTGGAGGAGC GCAAGGAACG TTACGAGGAC ATGATGCGGG CCTTGCGTGC CGCCGACCTG 
AACGCCTGGC GGGACAACTT TCTGCGCGAC CTGCGAACCT TCGGCCGGCA CCGGGTGGTG 
ACGGCGAGCC GTGCCGCCGT CTGA

Protein sequence

MSRLVVISNR VAPIREGKIA AGGLAVGVYD ALRQNGGIWF GWNGEVGQKP ETACESAGNI 
TYVTLGLSKP DYNEYYRGFS NATLWPIFHY RIDLARYSRE EYLGYRRVNA MLAEKLKPLL 
RPDDILWVHD YHLIPFAAAC RQLGIGNRIG FFLHIPFPTT EVLTAVPPHR DLFQTLCDYD 
LVGFQTESDR MAFQDYVCRE LDGLIGTDGS LTACGRNFRA GVYPIGVMPD DIRRLADSYR 
GRRPMIGRTA EGKLRKTLIS VDRLDYSKGL VERFLAYEQF LEHYPEHRRN VELIQIAPTS 
RTDVKTYRAI RKQLETVAGH VNGRLADLDW MPLHYLNKSL ERRTLMGLFR TANVGLVTPL 
RDGMNLVAKE YVAAQNPADP GVLVLSRFAG AAHELGAALI VNPYDCLGMA EAMDRALRMP 
LEERKERYED MMRALRAADL NAWRDNFLRD LRTFGRHRVV TASRAAV