Gene Avin_08740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_08740
Symbol	xylK
ID	7759824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	829300
End bp	830349
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	67%
IMG OID	643803788
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_002798090
Protein GI	226943017
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTTCG ATCCGCACAA GAAGCTGTAC ATCTCCGACG TGACCCTGCG CGACGGCAGC 
CATGCCGTGC GTCACCAGTA CTCGATCAGG AACGTCCAGG ACATCGCCCG CGCACTGGAC 
AAGGCGAAAG TGGATTCCAT CGAGGTCGCC CACGGCGACG GCCTGCAGGG TTCGAGCTTC 
AACTACGGCT TCGGCGCGCA CAGCGACATC GAGTGGATCG AGGCGGTGGC CGAGGTGGTG 
ACTCATGCCA GGATCGCCAC CCTGTTGCTG CCCGGCATCG GCACCGTCCA CCACCTCAAG 
GAGGCCTACG ACGCCGGCGC GCGCATCGTC CGGGTGGCCA CCCACTGCAC CGAGGCGGAC 
GTGTCCAGAC AGCACATCGC CTACGCGCGC GAGTTGGGCA TGGACACCGT GGGCTTCCTG 
ATGATGAGCC ACATGACCAC GCCGCAGAAC CTCGCCGTCG AGGCGAAGAA GATGGAAAGC 
TACGGCGCCA CCTGCATCTA CGTGGTCGAC TCCGGCGGGG CCTTGAGCAT GCAGGACGTG 
CGCGAGCGCT TCCGCGCGGT CAAGGACCTG CTGGAGCCTT CGACCCAGAC CGGCATCCAC 
GCCCACCACA ACCTCAGCCT CGGGGTGGCC AACTCCATCG TCGCGGTGGA GGAGGGCTGC 
GACCGCATCG ACGCCAGCCT CGCTGGCATG GGCGCGGGGG CGGGCAATGC GCCGCTGGAG 
GTGTTCGTCG CCGCGGCCGA GCGGCTGGGC TGGAACCACG GCACCGACCT CTACACCCTG 
ATGGACGCCG CCGACGAGAT CGTCCGGCCG TTGCAGGACC GCCCGGTACG GGTCGACCGC 
GAGACGCTGG CGCTGGGTTA TGCCGGGGTC TATTCGAGCT TTCTGCGCCA CGCCGAGGTG 
GCGGCGAGCA AATATGGCCT GAGCACCGTG GACATCCTGG TCGAACTGGG CCGGAGGCGG 
ATGGTCGGCG GCCAGGAGGA TATGATCGTC GATGTGGCGC TGGATCTGCT GCGCCAGCGG 
GGAGACGCTG CCCGGCAGGC CGCGGTGTAA

Protein sequence

MTFDPHKKLY ISDVTLRDGS HAVRHQYSIR NVQDIARALD KAKVDSIEVA HGDGLQGSSF 
NYGFGAHSDI EWIEAVAEVV THARIATLLL PGIGTVHHLK EAYDAGARIV RVATHCTEAD 
VSRQHIAYAR ELGMDTVGFL MMSHMTTPQN LAVEAKKMES YGATCIYVVD SGGALSMQDV 
RERFRAVKDL LEPSTQTGIH AHHNLSLGVA NSIVAVEEGC DRIDASLAGM GAGAGNAPLE 
VFVAAAERLG WNHGTDLYTL MDAADEIVRP LQDRPVRVDR ETLALGYAGV YSSFLRHAEV 
AASKYGLSTV DILVELGRRR MVGGQEDMIV DVALDLLRQR GDAARQAAV