Gene Avin_40120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_40120
Symbol
ID	7762898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	4066194
End bp	4067867
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	68%
IMG OID	643806871
Product	2-isopropylmalate synthase
Protein accession	YP_002801123
Protein GI	226946050
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00970] 2-isopropylmalate synthase, yeast type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.397785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATGC TCAAAGATCC GTCGCAGAAA TACCGCCCCT TCGCGCCGAT CGCCCTGCGC 
GACCGCACCT GGCCGGACCG GGTGATCGAC AAGGCGCCGC TCTGGCTGAG TACCGATTTG 
CGCGACGGCA ACCAGTCGCT GATCGAGCCG ATGGATGCCG CGAAGAAGAT GCGCTTCTTC 
AAGACCCTGG TGCAGGTCGG CCTGAAAGAG ATCGAGGTGG GCTTCCCGTC CGCCTCGCAG 
ACCGATTTCG ACTTCGTCCG CGAACTGATC GAGGGCGGCC ACATCCCCGA CGACGTAACC 
ATCCAGGTGC TGACCCAGGC CCGCGACGAC CTCATCGAGC GGACCTTCGA ATCGCTGAAG 
GGTGCGAAGA AGGCCATCGT CCACTACTAC AACGCCTGCG CGCCGAGCTT CCGGCGCATC 
GTGTTCGACC AGGACAAGGA AGGCGTCAAG CGGATCGCCG TCGCCGCCGG CCGGACCATC 
AAGCGCCTGG CCGCCGCCGC GCCGGAAACC CGGTGGGGCT TCGAGTATTC CCCCGAGGTG 
TTCAGCTCCA CCGAGAGCGA TTTCGCCGTC GAGGTGTGCA ACGCGGTGGT CGAGGTGTTC 
CAGCCGACCC CGGCCAACCG CCTGATCCTC AACCTGCCGG CCACCATCGA ATGCGCCACG 
CCGAACCACT ACGCCGACCA GATCGAGTGG TTCTGCCGGC ATGTCGACAG GCGCGACAGC 
GTCATCGTCA GTCTGCACAC CCACAACGAC CGCGGCACCG GCGTGGCCGC CAGCGAGCTG 
GGCCTGATGG CCGGCGCCGA CCGCGTCGAG GGCTGCCTGT TCGGCAACGG CGAGCGTACC 
GGCAACGTCG ACCTGGTGAC CCTGGCGCTG AACCTCTACA CCCAGGGCGT CGACCCCGGG 
CTGGACTTCT CCGACATCGA CGCGGTGCGC AAGGTGGTCG AGGAATGCAA CCAGTTGCCG 
GTACACCCGC GCCATCCCTA CGTCGGCGAC CTGGTGCACA CCGCCTTCTC CGGCTCGCAC 
CAGGACGCGA TCCGCAAGGG CTTCGCCCAG CAGGACCCGG AGGGCGTCTG GGAGGTGCCC 
TATCTGCCGA TCGACCCGGC CGACATCGGC CGCAGCTACG AGGCGGTGAT CCGCGTCAAC 
AGCCAGTCGG GCAAGGGCGG CATCGCCTAC CTGCTCGAAC AGGAGTACGG CATCAGCCTG 
CCGCGGCGCA TGCAGATCGA GTTCAGCCAG GTGGTGCAGA AGGAGACCGA TCGCCTCGGC 
CTGGAGATGA GCGCCGCGCA GATCCACGCG CTGCTCGAAG CCGAGTACCT GCGCGCCGAG 
ACGCCCTACG CCTTGAAGGG CCATCGCCTG CAGGAGGAGA ACGGTACCTG CGCGCTGGAC 
GTGGAAGTCT TCGACAAGGG CGAGAGCCGC CATTGGCGCG GCATCGGCAA GGGCCCGCTG 
GAGGCGCTGG TCGCCTGCCT GCCGGTCCGC GTGGAGATCA TGGACTACCA CGAGCACGCC 
ATCGGCGCCG GCAGCCATGC CAGGGCCGCG GCCTACATCG AGCTGCGCCT CGACGGCCAG 
CGTTCGCTGC ACGGCCTGGG CATCGACGAG AACCTGACCA CGGCGAGCAT CCGCGCCCTG 
TTCAGTGCCC TCAACCGCGC CCTCGGCCAG CAGGCGTCGA TCCGCGCGGC CTGA

Protein sequence

MPMLKDPSQK YRPFAPIALR DRTWPDRVID KAPLWLSTDL RDGNQSLIEP MDAAKKMRFF 
KTLVQVGLKE IEVGFPSASQ TDFDFVRELI EGGHIPDDVT IQVLTQARDD LIERTFESLK 
GAKKAIVHYY NACAPSFRRI VFDQDKEGVK RIAVAAGRTI KRLAAAAPET RWGFEYSPEV 
FSSTESDFAV EVCNAVVEVF QPTPANRLIL NLPATIECAT PNHYADQIEW FCRHVDRRDS 
VIVSLHTHND RGTGVAASEL GLMAGADRVE GCLFGNGERT GNVDLVTLAL NLYTQGVDPG 
LDFSDIDAVR KVVEECNQLP VHPRHPYVGD LVHTAFSGSH QDAIRKGFAQ QDPEGVWEVP 
YLPIDPADIG RSYEAVIRVN SQSGKGGIAY LLEQEYGISL PRRMQIEFSQ VVQKETDRLG 
LEMSAAQIHA LLEAEYLRAE TPYALKGHRL QEENGTCALD VEVFDKGESR HWRGIGKGPL 
EALVACLPVR VEIMDYHEHA IGAGSHARAA AYIELRLDGQ RSLHGLGIDE NLTTASIRAL 
FSALNRALGQ QASIRAA