Gene Avin_31350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_31350
Symbol
ID	7762034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3241379
End bp	3242557
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	72%
IMG OID	643806009
Product	DszC-like desulfurization enzyme
Protein accession	YP_002800273
Protein GI	226945200
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAGCC CATCCACCCC CGAAGACTGG CTGGCGCTGG CCCATGGGAT CGGCGAGGAA 
TTCGCCCGCG ACATCGCCCG CCGCACCCGC ACCCGCGAAC GTCCCGACAC CCAGTTGCGG 
CGCCTCAAGG ACAGCGGCCT GACCAATCTG GCGATCCCCC GCGAGCTGGG CGGCGCCGGC 
CAGCGCTGGT CGCTGATCGT GCGCACCATC CGCGAACTGG CCGCCGGCGA CGGCTCGGTC 
GGCATGCTCT ATGGCTACCA CCAGCTCAAC CTGGTCAACC TGCGCCGCGA GCCGCAGCCG 
CGCCGCGACC GCCTTCTGGC GGAGATCGCC GAACGCCGGC TGTGGCTGGC CGGGGTGGTC 
AATCCGCGCG ACGACGACAT CCTCGCCACG CCGGACGGCG AGGGTTTCCG CCTCAACGGC 
CGCAAGGGCT TCTGCAGCGG CGCGGCCTTC GCCGATCTGC TCAGCGTCAG CGCGCGCCAT 
GCCCACGACG GCCAGCGGCT GATGGCGCTG ATCCCTTCCG ACCGTCCCGG CCTGCACTAC 
GCCGAGGATT GGGACCATTT CGGCGTGGAG CGCAGCGACA GCGGCAGCTT CGTCCTGAGC 
GAGGTGCGCG CCGAACCCGG CGAAGTCATC GCCAACGACC TGGAGGACGG CAGCGATTTC 
TCCGCGGTGA TCCGCACCCC GGTCAACCAG TCCGCCTTCA CCCAGTTCTA CCTCGGCAAC 
GCCCTCGGCG CGCTGCGCGC GGCGCGCGCC TACGTGCACC GCGAAGGCCG CGCCTGGCTG 
CACGCGGGGG TCGACGAGGC CCATCGGGAC CCGCTGCTGG TCAGCCAGTT CGGCGAGCTG 
TGGATCGCCC TGCAGGGCGC CATCGCCCTG GCCGACCGCG CCGCGCTCAA GGTCGACGAG 
TTGCTCGCCG CGGACGAGGC CTTCACCCCG GAACTGCGCG GCGAGGCCGC CGTCGAGGTG 
GCCAGCGCCA AGGTGCTCGC CGCGCGCACC GCGCTCGATG TCACCAGCCG GGTGTTCGAG 
GTGATGGGCG CGCGCGCCAC CCACAACCGC TACGCCTTCG ACCGCTTCTG GCGCGACACG 
CGCACCCACA GCCTGCACGA CCCGCTCGCC CACAAGCTGC TGGAAGTCGG CGAATACGCC 
CTGAACGGCC AGTACCCGCC GGTGCGGGCC TACACCTGA

Protein sequence

MGSPSTPEDW LALAHGIGEE FARDIARRTR TRERPDTQLR RLKDSGLTNL AIPRELGGAG 
QRWSLIVRTI RELAAGDGSV GMLYGYHQLN LVNLRREPQP RRDRLLAEIA ERRLWLAGVV 
NPRDDDILAT PDGEGFRLNG RKGFCSGAAF ADLLSVSARH AHDGQRLMAL IPSDRPGLHY 
AEDWDHFGVE RSDSGSFVLS EVRAEPGEVI ANDLEDGSDF SAVIRTPVNQ SAFTQFYLGN 
ALGALRAARA YVHREGRAWL HAGVDEAHRD PLLVSQFGEL WIALQGAIAL ADRAALKVDE 
LLAADEAFTP ELRGEAAVEV ASAKVLAART ALDVTSRVFE VMGARATHNR YAFDRFWRDT 
RTHSLHDPLA HKLLEVGEYA LNGQYPPVRA YT