Gene Avin_30570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_30570
Symbol	lapG
ID	7761957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3165878
End bp	3166930
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	68%
IMG OID	643805933
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_002800197
Protein GI	226945124
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00100274
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGCC AGTCCGACAG CCTGAAAGGC CGCAAGGTCG TTTTCCATGA CATGTGCCTG 
CGCGACGGCA TGCACGCCAA GCGCGAGCAG ATCGGCGTCG AGCAGATGAT CGCGGTCGCC 
ACCGCCCTCG ACGCCGCCGG CGTGCCCTAC ATCCAGGTCA CCCATGGCGC CGGCCTCGGC 
GGCAACTCGC TGCAGCACGG CTTTGCCCCG CACAGCAACG AGGAATACAT CGGCGCGGTG 
GCCGCGAAGA TGAAACAGGC CAAGGTTTCG GTGCTGCTGA TTCCGGGGCT CGGCACCATG 
AAGGAGCTGC AGTCGGCCTT CGACTGCGGC GCGCGCAGCG TGCACGTCGC CACCCACTGC 
ACTGAGGCGG ACACCTCGCC GCAGCACATC GCCTTCGCCC GCAAGCTGGG CATGGACACC 
TCCGGCTTCC TGATGATGTC ACACCTCAAC GACCCGGCCG GCATCGCCCG GCAGGGCAAG 
CTGATGGAGT CCTACGGCGC GCAGACCGTC TACGTCACCG ACTCGGCCGG CTACATGTTG 
CCTGAGGACG TGAAGGCGCG CGTCGGCGCG CTGCGCGAGG TGCTGGCGCC GGAAACCGGG 
ATCGGTTTCC ACGGCCACCA CAACCTGGGC ATGGGCATCG CCAACTCCAT CGCCGCCATC 
GAGGCCGGCG CCAGCCGCAT CGACGGTTCG GTGGCGGGCC TCGGCGCCGG CGCCGGCAAC 
ACGCCGCTGG AGGTGTTCGC CGCGGTGTGC GAGCGCATGG GCATCGACAC CGGCGTCGAT 
CTGTTCAGGC TGATGGACGT GGCCGAGGAC ATCATCGTGC CGATGATGGA GCATGTGGTG 
CGCGTCGACC GCGAGTCGCT GACCCTGGGC TACGCCGGCG TCTACTCGAC CTTCCTGCTG 
CATTCCAAAC GCGCCGCCGA GCGCTTCGGC GTGCCGGCGC GCGACATCCT GGTCGAGCTG 
GGCCGCAAGA AGATGATCGG CGGCCAGGAG GACATGATCC TCGACACCGC GATGAGCATG 
GCCAAGGCGC GCGGGCTGCT GAAGAGCGCC TGA

Protein sequence

MMSQSDSLKG RKVVFHDMCL RDGMHAKREQ IGVEQMIAVA TALDAAGVPY IQVTHGAGLG 
GNSLQHGFAP HSNEEYIGAV AAKMKQAKVS VLLIPGLGTM KELQSAFDCG ARSVHVATHC 
TEADTSPQHI AFARKLGMDT SGFLMMSHLN DPAGIARQGK LMESYGAQTV YVTDSAGYML 
PEDVKARVGA LREVLAPETG IGFHGHHNLG MGIANSIAAI EAGASRIDGS VAGLGAGAGN 
TPLEVFAAVC ERMGIDTGVD LFRLMDVAED IIVPMMEHVV RVDRESLTLG YAGVYSTFLL 
HSKRAAERFG VPARDILVEL GRKKMIGGQE DMILDTAMSM AKARGLLKSA