Gene Avin_38040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_38040
Symbol
ID	7762695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3848965
End bp	3849954
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	66%
IMG OID	643806668
Product	Aldo/keto reductase
Protein accession	YP_002800921
Protein GI	226945848
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATGC GAAAACTGGG AAGCAGCGGG CTGGAAGTCT CGGCGCTCGG CCTGGGCTGC 
ATGGGCCTGA GTCATGGTTA CGGCCCCGCC ACGGACACCG GGCAGGCCGT CTCGCTGATC 
CGCGCGGCGG TCGAACGTGG CGTGACCTTC TTCGATACCG CCGAGGTCTA CGGCCCCTAT 
CTCAACGAGG AAGTGGTCGG CGAGGCACTC GCCCCGGTAC GCGAGCGGGT GGTGATCGCC 
ACCAAGTTCG GCTTCACCTT CGGCGACGAT AACAAACAGC AGATTCTCGA CAGCAGACCC 
GAACACATCC GCTGGGCGGT CGAGGGTTCG CTCAAGCGCC TGCGCACCGA TCACATCGAC 
CTGCTATACC AGCACCGGGT CGATCCCGAG GTGCCGATCG AGGACGTGGC CGGGATGGTC 
AAGGAGCTGA TCGCCGAGGG CAAGGTCAAG CACTTCGGCC TCTCCGAGGC CGGCGCGCAG 
ACGATCCGTC GCGCCCACGC CGTGCAGCCA GTGACGGCTC TGCAGAGCGA GTATTCGCTG 
TGGTGGCGCG AGCCCGAGCA GGAAATCCTG CCGACGCTGG AAGAGCTCGG CATCGGCTTC 
GTACCCTTCA GCCCGCTGGG CAAGGGCTTT CTCACCGGAG CGATCGGCGC CTCGACCACC 
TTCGGCAGCG ACGATTTCCG CAGCACAGTG CCGCGCTTCT CGCCGCAGGC CCTGCAGGCC 
AACCAGGCCC TGGTGGAATC GCTCGGCCGG ATCGCCAGCG ACAAGGGCGT GACACCCGCA 
CAGGTCGCCC TGGCTTGGCT GCTGGCGCAG AAGCCCTGGA TAGTGCCGAC TCCCGGTACC 
ACCAAGTTGC ACCGCCTGGA AGAAAACCTG GGCGCCGCGT CCATCGAGCT TACCGAAGCG 
GACCTGGGCA AGATCGCGAC CGCACTGAAA CAGGTGAAGA TCCAAGGCGA TCGCTATCCA 
GCGGCGCTAC AGGCGCGCGT GGGCCGTTAG

Protein sequence

MQMRKLGSSG LEVSALGLGC MGLSHGYGPA TDTGQAVSLI RAAVERGVTF FDTAEVYGPY 
LNEEVVGEAL APVRERVVIA TKFGFTFGDD NKQQILDSRP EHIRWAVEGS LKRLRTDHID 
LLYQHRVDPE VPIEDVAGMV KELIAEGKVK HFGLSEAGAQ TIRRAHAVQP VTALQSEYSL 
WWREPEQEIL PTLEELGIGF VPFSPLGKGF LTGAIGASTT FGSDDFRSTV PRFSPQALQA 
NQALVESLGR IASDKGVTPA QVALAWLLAQ KPWIVPTPGT TKLHRLEENL GAASIELTEA 
DLGKIATALK QVKIQGDRYP AALQARVGR