Gene Avin_38200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_38200
Symbol	pcaF
ID	7762711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3865658
End bp	3866863
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	71%
IMG OID	643806685
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_002800937
Protein GI	226945864
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGCG ACGTCTTCAT CTGCGATGCC GTGCGCACGC CCATCGGCCG CTTCGGCGGC 
GGCCTGGCCG GCGTGCGCGC CGACGACCTG GCCGCCATCC CGCTGAAGGC GCTGCTGGCG 
CGCAACCCGC GACTCGATCC GGCCGCCGTC GATGAGGTGT TCCTGGGCTG CGCCAACCAG 
GCCGGCGAGG ACAACCGCAA CGTGGCGCGC ATGGCGTCGC TGCTCGCCGG CCTGCCGGAG 
ACGGTGCCGG GGGTGACACT CAACCGCCTG TGCGCCTCGG GCATGGATGC GATCGGCACC 
GCCGCCCGCG CCATCGCCAG CGGCGAGATC GAGCTGGCCA TCGCCGGCGG CGTGGAGTCC 
ATGTCGCGTG CGCCCTTCGT GATGGGCAAG GCCGACGCCG CCTTCTCGCG CAACATGAAG 
ATCGAGGACA CCACCATCGG CTGGCGTTTC GTCAACCCGT TGATGAAGCA GCAGTACGGC 
GTGGACTCCA TGCCGGAAAC CGCCGACAAC GTCGCCGACG ACTACCGGAT CGGCCGCGCC 
GACCAGGACG CCTTCGCCCT GCGCAGCCAG CAGCGCGCGG CGGCGGCCAT GGAGTCCGGC 
TACTTCGCCG AGGAGATCGT CCCGGTGGTC ATCAAGACCA GGAAGGGCGA GACGCTGATC 
GACACGGACG AGCATCCGCG CCCGGACACC AGCGCCGAGG CGCTGGCCAG GCTCAAGCCG 
GTCAACGGCG AGGGCAAGAC GGTTACCGCC GGCAACGCCT CGGGGGTCAA CGACGGCGCC 
GCGGCGCTGA TCCTGGCCTC CGCCGAGGCG GTGCGCAAAT ACGGCCTGAA GGCCCGCGCC 
CGGGTGCTCG GCATGGCCAG CGCCGGGGTC GCGCCGCGGA TCATGGGCTA CGGCCCGGTG 
CCGGCGGTGC GCAAGCTCCT GCAGCGCTTG GAGCTGAGCA TCGACGCCTT CGATGTGATC 
GAACTCAACG AGGCCTTCGC CAGCCAGGGC CTGGCGGTAT TGCGCGACCT GGACCTCGCC 
GACGACGATG CGCGGGTCAA CCCCAACGGC GGCGCCATCG CCCTCGGCCA CCCGCTGGGC 
ATGAGCGGCG CGCGCCTGGT GCTGACCGCC CTGCATCAAC TGGAGAAGTC CGGCGGCAGC 
AAGGGCCTGG CGACCATGTG CATCGGCGTC GGCCAGGGGC TGGCGCTGGC CATCGAGCGC 
GTCTGA

Protein sequence

MSRDVFICDA VRTPIGRFGG GLAGVRADDL AAIPLKALLA RNPRLDPAAV DEVFLGCANQ 
AGEDNRNVAR MASLLAGLPE TVPGVTLNRL CASGMDAIGT AARAIASGEI ELAIAGGVES 
MSRAPFVMGK ADAAFSRNMK IEDTTIGWRF VNPLMKQQYG VDSMPETADN VADDYRIGRA 
DQDAFALRSQ QRAAAAMESG YFAEEIVPVV IKTRKGETLI DTDEHPRPDT SAEALARLKP 
VNGEGKTVTA GNASGVNDGA AALILASAEA VRKYGLKARA RVLGMASAGV APRIMGYGPV 
PAVRKLLQRL ELSIDAFDVI ELNEAFASQG LAVLRDLDLA DDDARVNPNG GAIALGHPLG 
MSGARLVLTA LHQLEKSGGS KGLATMCIGV GQGLALAIER V