Gene Avin_07350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_07350
Symbol
ID	7759687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	693353
End bp	694363
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	69%
IMG OID	643803652
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_002797956
Protein GI	226942883
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.19996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGATCC AGATCCCACC CCGCTCGCAC TGCCCGTCCT CCGAGATCAC CCCGGAGTCC 
GTCTACCTGT CGCGCCGACG CTTTCTCGGC GCCGGGGCCG TGGCGCTGGG CGCCGCCGTC 
CTGCCCGCCC GGTCCCGCGC CGAAAGCCAG CGCTACGCCG GCGTCGAACC GGGCCGCCCG 
CCCGCCTGGT TCACCGAGAA GCTGCCGGAT ACCCGCTGGC AGGCGGTCGA GGCGCCGGGC 
GATGCGCTCA CCCCGTTCCA GGATGCCAGC CACTACAACA ACTTCTACGA GTTCGGCCCG 
GACAAGGGCG ATCCGGCGGC GAACGCCGGC CGGCTGCCCA CCGAACCCTG GAGCGTGCGG 
ATCGACGGCG AGGTCGGCAA GCCGGGCCGG TACGCCCTGG AAGATCTGGT CCGCCCGCAC 
GCACTGGAGG AGCGCATCTA CCGGCTGCGC TGCGTGGAGG CCTGGTCGAT GGTGATCCCC 
TGGCTGGGCT TCCCCCTCGC CGAGTTGCTC AAGCGCGCCG AGCCTACCGG CAACGCCAGG 
TACGTGGCCT TCGAGACGCT GGTCGATCCC GAGCACATGC CGGGCCAGCG CTCGCGCTTC 
GCCCTGCTCG ACTGGCCGTA CCGCGAGGGC CTGCGGCTGG ACGAGGCGAT GCACCCGCTG 
ACCCTCCTGG CGGTGGGCAT GTACGGTCGC GTGCTGCCCA ACCAGAACGG CGCGCCGCTG 
CGGCTGGTCG TACCCTGGAA GTACGGTTTC AAGAGCATCA AATCGATCGT GCGCATCAGC 
CTGACCGAAC GCCAGCCCTA CACCAGTTGG CAGAACCGGG CACCCGAGGA GTACGGCTTC 
TACGCCAACG TCAATCCCGC CGTAGACCAC CCGCGCTGGA GCCAGAAACG CGAACGGCGC 
CTGCCGGGCA GCCTGTTCAG TCCCAACCTG CGCGATACCC TGCCGTTCAA CGGCTATGCC 
GAGGAAGTCG CCGGCCTCTA CGCCGGCATG GACCTGACCA AGGACTACTG A

Protein sequence

MLIQIPPRSH CPSSEITPES VYLSRRRFLG AGAVALGAAV LPARSRAESQ RYAGVEPGRP 
PAWFTEKLPD TRWQAVEAPG DALTPFQDAS HYNNFYEFGP DKGDPAANAG RLPTEPWSVR 
IDGEVGKPGR YALEDLVRPH ALEERIYRLR CVEAWSMVIP WLGFPLAELL KRAEPTGNAR 
YVAFETLVDP EHMPGQRSRF ALLDWPYREG LRLDEAMHPL TLLAVGMYGR VLPNQNGAPL 
RLVVPWKYGF KSIKSIVRIS LTERQPYTSW QNRAPEEYGF YANVNPAVDH PRWSQKRERR 
LPGSLFSPNL RDTLPFNGYA EEVAGLYAGM DLTKDY