Gene Avin_34140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_34140
Symbol	metZ
ID	7762309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3486396
End bp	3487607
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	68%
IMG OID	643806276
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_002800538
Protein GI	226945465
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATCG AGTGGGATGC CGGGCGGCTG GACAGCGACC TGGAGGGTGC CGGCTTCGAC 
ACCCTGGCGG TGCGGGCCGG TCAGCGGCGC ACTCCCGAGG GCGAGCACGG CGAGGCCCTA 
TTCATGACCT CCAGCTACGT GTTCCGCAGC GCTGCCGATG CCGCCGCCCG CTTTGCCGGC 
GAGCAGCCCG GCAACGTCTA CTCCCGCTAC ACCAATCCCA CGGTGCGTAC CTTCGAGGAG 
CGCATCGCCG CCCTCGAAGG GGCCGAGCAG GCGGTTGCCG CGGCCTCCGG CATGGGCGCC 
ATCCTGGCGA TGGTGATGAG CCTGTGCAGC GCCGGCGACC ATGTGCTGGT GTCGCGCAGC 
GTATTCGGTT CGACCATCAG CCTGTTCGAC AAGTATTTCA AGCGTTTCGG CATCGAGGTC 
GACTATCCGC CCCTGGCGGA TCTGGAAGCC TGGGCCGCCG CCTGCAAGCC GAACACCCGG 
CTGTTCGTCG TCGAGTCTCC ATCCAACCCC CTGGCCGAGT TGGTGGACAT CGCCGCGCTG 
GCCGACATCG CCCATGCCCG TGGCGCCCTG CTGGCGGTGG ACAACTGCTT CTGCACGCCG 
GCGTTGCAGA AGCCGTTGGC GCTCGGCGCC GATATCGTCA TCCATTCGGC GACCAAGTAC 
ATCGACGGCC AGGGGCGTTG CCTCGGCGGC GTGGTGGCCG GCAGCGCCAA GCTGATGCAG 
GAGGTGGTCG GCTTCCTGCG TACCGCCGGC CCGACGCTCA GCCCCTTCAA TGCCTGGCTG 
TTCCTCAAGG GGCTGGAAAC CCTCCGGGTG CGCATGCAGG CGCACTGTGC CAGCGCCCAG 
GCGCTGGCCG AGTGGCTGGA GCAGCAGCCC CAGGTGGTCA GGGTCCATTA CGCCGGTCTG 
TCCAGCCATC CGCAGCACGA GTTGGCCAGG CGCCAGCAGA GCGGCTTCGG CGCGGTGGTC 
AGTTTCGAGG TCCGGGGCGA CAAGGCGGCC GCCTGGCGGG TCATCGACAA TACCCGGATG 
ATCTCCATCA CCACCAACCT GGGCGATACC AAAACCACCA TCGCCCATCC GGCCACCACT 
TCCCACGGAC GCCTGACCCC GGAGGCGCGG GCGGCGGCCG GGATCAGTGA CAGCCTGATC 
CGTGTGGCGG TCGGCCTGGA GGACATCGAA GACATCAAGG CCGATCTTGC CCGAGGGTTG 
TCCGCACTGT GA

Protein sequence

MTIEWDAGRL DSDLEGAGFD TLAVRAGQRR TPEGEHGEAL FMTSSYVFRS AADAAARFAG 
EQPGNVYSRY TNPTVRTFEE RIAALEGAEQ AVAAASGMGA ILAMVMSLCS AGDHVLVSRS 
VFGSTISLFD KYFKRFGIEV DYPPLADLEA WAAACKPNTR LFVVESPSNP LAELVDIAAL 
ADIAHARGAL LAVDNCFCTP ALQKPLALGA DIVIHSATKY IDGQGRCLGG VVAGSAKLMQ 
EVVGFLRTAG PTLSPFNAWL FLKGLETLRV RMQAHCASAQ ALAEWLEQQP QVVRVHYAGL 
SSHPQHELAR RQQSGFGAVV SFEVRGDKAA AWRVIDNTRM ISITTNLGDT KTTIAHPATT 
SHGRLTPEAR AAAGISDSLI RVAVGLEDIE DIKADLARGL SAL