Gene Anae109_4291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_4291
Symbol
ID	5376121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	5031071
End bp	5032375
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	71%
IMG OID	640845819
Product	inositol-3-phosphate synthase
Protein accession	YP_001381453
Protein GI	153007128
COG category	[I] Lipid transport and metabolism
COG ID	[COG1260] Myo-inositol-1-phosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.025414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.498741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCG GTATGGGGGT GAAGCCCGTG CGCAAGGGCG AGAAGCTCGC CGTCCTTCTG 
CCCGGGATGG GTGCCGTCGC GACGACCGCC GTCGCCGGCG CGATCGCGGT GCGGCGGAAG 
CTCGCGTCCC CGGTCGGCTC GCTCACGCAG CTCGGCCACC TCATCGACGC CCGGGGCGAG 
GCCGGTCCGC GCGTCGCCGA CGTACTCCCG CTCGCGAGCC TCGACGACCT CGTGTTCGGC 
GGATGGGACC CGATCCCCGA CGACGCGTAC GCCGCCGCCC TCCGCGCGCG GGTGCTCGGC 
CGCGAGCACC TCGACCCGAT CAAGGACGAG CTCGAGGCCA TCAAGCCCAT GCCCGCGGTG 
TTCGACACCG AGTGGGTCCG CCGCCTCGAC GGGCCGAACG TGAAGAAGGG CACCCTCCGC 
CAGAAGGCCG ACGCCCTCCA GGCGGACATC CGCGGCTTCC TGCAGAAGCA CGGCTGCGCG 
CGCGGCGTGA TGGTGTGGAC CGGCTCCACT GAGGTCTACG CGCAGGTCGG GCCGGCGCAC 
CAGTCGCTCA AGGCGTTCGA GGCCGCGCTC GACAAGGACG ATGCGTCCAT CGCGCCGTCG 
ATGATCTACG CGTACGCGGC GATCAGGTGC GGCGTCCCGT TCCTGAACGG CGCGCCGAAC 
CTGTCGCAGG ACACCCCGGC CCTCCAGGAG CTGGCCGAGC GCGAGGGCGT CGTCACCGGC 
GGCAAGGACT TCAAGACCGG GCAGACGCTG ATGAAGACGA CGATCGCGCC CATGCTCCGG 
GCGCGGCTCC TCGGCCTCGA CGGGTGGTTC TCGACGAACA TCCTCGGCAA CCGCGACGGC 
GAGGTGCTGG ACGACGCCGC GAGCTTCAAG ACGAAGGAGG TCTCGAAGCT GGGCGTGCTC 
GATCAGATCC TCGATCCGCG GCGCCTCCCC GAGCTCTACG GGGACATGGA TCACAAGGTC 
ACGATCCACT ACTACCCGCC GCGCGGCGAC AACAAGGAAG GCTGGGACGC CATCGATCTC 
GTCGGGTGGC TCGGCTACCC CATGCAGATC AAGGTGAACT TCCAGTGCCG CGACTCGATC 
CTCGCGGCGC CGCTCGTGCT CGATCTCGCG CTCCTCGCCG ACCTCGGCCA GCGCGCGGGT 
GAGCGCGGCG CGCAGGAGTG GCTGTCGTTC TTCTTCAAGA GCCCGGTCGT CAACCCCGGC 
CACTCGCAGG TGCACGACCT CTTCCAGCAG CAGGCGAACC TCCACGCGCA GCTCCGCCGC 
TACGCGGAGG CCGCCGCGGC CGCCACGCAG AGCGCGGTCG GCTAG

Protein sequence

MKTGMGVKPV RKGEKLAVLL PGMGAVATTA VAGAIAVRRK LASPVGSLTQ LGHLIDARGE 
AGPRVADVLP LASLDDLVFG GWDPIPDDAY AAALRARVLG REHLDPIKDE LEAIKPMPAV 
FDTEWVRRLD GPNVKKGTLR QKADALQADI RGFLQKHGCA RGVMVWTGST EVYAQVGPAH 
QSLKAFEAAL DKDDASIAPS MIYAYAAIRC GVPFLNGAPN LSQDTPALQE LAEREGVVTG 
GKDFKTGQTL MKTTIAPMLR ARLLGLDGWF STNILGNRDG EVLDDAASFK TKEVSKLGVL 
DQILDPRRLP ELYGDMDHKV TIHYYPPRGD NKEGWDAIDL VGWLGYPMQI KVNFQCRDSI 
LAAPLVLDLA LLADLGQRAG ERGAQEWLSF FFKSPVVNPG HSQVHDLFQQ QANLHAQLRR 
YAEAAAAATQ SAVG