Gene Avin_51520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_51520
Symbol
ID	7763991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	5238683
End bp	5239726
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	69%
IMG OID	643807970
Product	Aldo/keto reductase
Protein accession	YP_002802204
Protein GI	226947131
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTATA GCGCCGCGCC GAACCGCTAC GAGCGCATCC CCTACCGCCG CGTCGGCCGC 
AGCGGCCTGG TGCTGCCGGC CCTGTCCCTG GGCCTGTGGC ACAACTTCGG TGACAGCACC 
CCGCTCGATA CCCAGCGCGC CCTGCTGCGC ACCGCCTTCG ACCTCGGCAT CAACCACTTC 
GACCTGGCGA ACAACTACGG GCCGCCCTAC GGCAGCGCCG AGACCAACTT CGGCCGCCTG 
CTGCGCGAGG ATTTCCGCGC CTATCGCGAC GAGCTGATCC TCTCCACCAA GGCCGGCTGG 
GACATGTGGC CCGGCCCCTA CGGCCAGGGC GGCGGTTCGC GCAAGTACGT ACTCGCCAGC 
CTCGACCAGA GCCTGCGGCG CATGGGCGTC GACTACGTGG ACATCTTCTA TTCGCACCGC 
TTCGATCCGC ACACGCCACT GGAGGAAACC GCCGGCGCCC TGGCCGACAC CGTGCGCCAG 
GGCAAGGCGC TATACGTGGG CATCTCCGCC TATTCGGAAG CCAAGACACG GGAAATGGCC 
GCCCTGTTGC ACGAGCACAG GGTGCCGCTG CTGATCCACC AGCCGGCCTA CAACCTGTTC 
AACCGCTGGA TCGAGAAGGA CCTGCTGGCC ACCACCGAGG ACCTCGGCGC CGGCGTGATC 
GCCTTCACCC CCCTGGCCCA GGGGCTGCTC ACCGACAAGT ACCTGGATGG CATCCCCGCC 
AATGCGCGGA TCAACCGTCC CGGCGGCGCC TCGCTGCGCC CCGAGCACCT GTCCGAGGCG 
AACATTCGGC GTGCCCGGGC GCTCGCCGAG ATTGCCCGCC GGCGCGGGCA GAGCCTGGCC 
CAGTTGGCCC TCGCCTGGCT GCTGCGCGAT GCGCGGGTGA CTTCGGCGCT GATCGGCGCC 
AGCCGCCCGG AACAGCTCGT CGAGAATGTC GCGGCGCTGG ACAACCTGGC ATTCAGCCCC 
GAAGAACTGG CGGAGATCGA CCGTCACGCC GCCGCAAGCG GCGTCAATCT CTGGGACAGG 
CCCTACACCG ACTGGCCAGC GTGA

Protein sequence

MSYSAAPNRY ERIPYRRVGR SGLVLPALSL GLWHNFGDST PLDTQRALLR TAFDLGINHF 
DLANNYGPPY GSAETNFGRL LREDFRAYRD ELILSTKAGW DMWPGPYGQG GGSRKYVLAS 
LDQSLRRMGV DYVDIFYSHR FDPHTPLEET AGALADTVRQ GKALYVGISA YSEAKTREMA 
ALLHEHRVPL LIHQPAYNLF NRWIEKDLLA TTEDLGAGVI AFTPLAQGLL TDKYLDGIPA 
NARINRPGGA SLRPEHLSEA NIRRARALAE IARRRGQSLA QLALAWLLRD ARVTSALIGA 
SRPEQLVENV AALDNLAFSP EELAEIDRHA AASGVNLWDR PYTDWPA