Gene Avin_22260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_22260
Symbol
ID	7761144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	2224341
End bp	2225639
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	70%
IMG OID	643805111
Product	guanine deaminase
Protein accession	YP_002799392
Protein GI	226944319
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.119985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCCT ACCGCGCCGC CCTGCTCCAC TGTCTCGCCG ATCCCCGCGA GGTCGGCATC 
GAGCGTTCGT ACCAGTATTT CGAGGACGGC CTGCTGCTGG TCGAGAACGG CAGGATCGTC 
CGGATCGGCG CCGCCGCCGA GCTGCTGCCG GGCCTGCCGG CCGGGGTCGG GGTGGCCGAG 
TACCGCGATG CGCTGATCGT CCCCGGCTTC GTCGACACCC ACATCCATTA CCCGCAACTG 
GACGTGATCG CCTCCTACGG CAGCCAGTTG CTGGAGTGGC TGGAAACCTA CACCTTCCCC 
GCCGAGGCGC GCTTCGCCGA CCCGGCGCAC GCCCGCGCCC AGGCGCGCCT GTTCCTCGCC 
GAGCTGTTGC GCAACGGCAC CACCACGGCG CTGGTGTTCG CCACCGTGCA TCCGCAGTCG 
GTGGACGCCT TCTTCGAGGA GGCCAGCCGG CTCGATCTGC GGATGATCGC CGGCAAGGTG 
CTGATGGACC GCAACGCCCC GGACGGACTG CGCGACAGCG CCGCCTCCGG CTACGCCGAG 
AGCCGCGCGC TGATCGAACG CTGGCACGGC AAGGGCCGCC TGCACTACGC AGTCACCCCG 
CGCTTCGCGC CGACCAGCAC GCCCGGACAG CTCGACCTGG CCGGCCGGCT GCTGCGCGAA 
TACCCCGGCC TCTACCTGCA CACCCACCTG TCCGAGAACC GCGCGGAGAT CGACTGGGTG 
AAGGAACTGT TCCCCGAGCG CCGGCATTAC CTGGACGTCT ACGACCACCA CCGCCTGCTC 
GGCGAGCGCT CGGTGTTCGC CCACGGCGTC CACCTCTGCG ACGACGAGTG CCGGCGGCTC 
GGCGAGAGCG GCTCGGCGGT GGCCTTCTGC CCGACCTCCA ACCTGTTCCT CGGCAGCGGC 
CTGTTCGACC TGGCCCGGCT GGAAGGCCAC GGCGTGCGCG TCGGCCTGGG CACCGACGTC 
GGCGGCGGCA CCAGCTTCTC CCAGTTGCAG AGCCTCAACG AGGCCTACAA GGTGCTGCAG 
TTGCAGGGGC AGAAACTCGA CCCGTTCAAG GCGCTGTACC TGGCCACCCT CGGCGGCGCC 
AGGGCGCTCT ACCTGGACGA GCGCATCGGC AACCTGCAGC CGGGCAAGGA CGCCGACTTC 
GTGGTGCTGG ACTGCAAGGC CACGCCGCTG CTCGCCCGCC GTCTGGAACA GGCGCGCAGC 
CTCGCGGAAA GGCTGTTCGC GCTGATGATC CTCGGCGACG ACCGCGCGGT GCGGGAAACC 
TTCGCCGCCG GGCGTTCGGT GCACCGGCGC GACGTCTGA

Protein sequence

MQAYRAALLH CLADPREVGI ERSYQYFEDG LLLVENGRIV RIGAAAELLP GLPAGVGVAE 
YRDALIVPGF VDTHIHYPQL DVIASYGSQL LEWLETYTFP AEARFADPAH ARAQARLFLA 
ELLRNGTTTA LVFATVHPQS VDAFFEEASR LDLRMIAGKV LMDRNAPDGL RDSAASGYAE 
SRALIERWHG KGRLHYAVTP RFAPTSTPGQ LDLAGRLLRE YPGLYLHTHL SENRAEIDWV 
KELFPERRHY LDVYDHHRLL GERSVFAHGV HLCDDECRRL GESGSAVAFC PTSNLFLGSG 
LFDLARLEGH GVRVGLGTDV GGGTSFSQLQ SLNEAYKVLQ LQGQKLDPFK ALYLATLGGA 
RALYLDERIG NLQPGKDADF VVLDCKATPL LARRLEQARS LAERLFALMI LGDDRAVRET 
FAAGRSVHRR DV