Gene Gdia_0084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0084
Symbol
ID	6973473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	96337
End bp	97566
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	643389615
Product	argininosuccinate synthase
Protein accession	YP_002274499
Protein GI	209542270
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0882429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0155281
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTAA AGGACGTCAA GAAGGTCGTG CTCGCCTATT CCGGCGGGCT CGATACATCG 
GTAATTCTGC GCTGGCTGCA GACCACCTAC GGGTGCGAGG TCGTCACCTT CACCGCCGAC 
CTCGGCCAGG GCGAGGAACT GGAACCCGCC CGCAAGAAGG CCGAAATGTT CGGCGTGAAG 
GAAATCTTCG TCGAGGACCT GCGCGAGACC TTCGTCAAGG ACTTCGTCTT CCCGATGTTC 
CGCGCCAACA CGCTGTATGA AGGCCAGTAC CTGCTGGGGA CCTCCATCGC GCGTCCGCTG 
ATCGCCCAGC GCCAGATCGA AATCGCCGAG GCCGTGGGTG CCGACGCCGT GGCCCATGGC 
GCGACGGGCA AGGGCAACGA CCAGGTGCGC TTCGAACTGG CCTATTACGC GCTGAAGCCC 
GACGTGACGG TCATCTCCCC CTGGCGGGAA TGGGACCTGA CCTCGCGCAC GCGGCTGCTG 
GCCTTCGCCG AGGAACATCA GATCCCTATC GCGAAGGACA AGCGCGGCGA GGCCCCGTTC 
TCGGTCGATG CCAACCTGCT GCACTCCTCG TCCGAAGGCA AGCTGCTGGA AGACCCTGCC 
GTCGCACCCG ATGAAATCGT CTTCCAGCGC ACGATCTCGC CCGAGGCCGC GCCGGACGTC 
GCGACCGAAA TCGCGATCGA TTTCGTCTCG GGCGACCCGG TGGCGCTGAA CGGCGTCACC 
CTGTCCCCCG CCACGCTGCT GGCGCGGCTG AACGAACTGG GCAAGGCCAA CGGGATCGGG 
CGGCTGGACC TGGTGGAAAA CCGCTTCGTC GGCATGAAGT CGCGCGGCAT CTACGAAACG 
CCGGGCGGCA CCATCCTGCT GGCGGCGCAT CGCAGCATGG AAACCATCAC GCTGGACCGC 
GAGGCCGGGC ACCTGAAGGA CAGCCTGATG CCCCGCTATG CCGAACTGAT CTATAACGGC 
TTCTGGTTCT CGCCCGAGCG GCGCATGCTC CAGGCCCTGA TCGACGAAAG CCAGCATTCC 
GTGACCGGAC GCGTGCGGCT GAAGCTGTAC AAGGGCAATG TGATCTGCGT CGGGCGGGAA 
AGCCCCCATA GCCTGTACGA TACCCGCGTT GTGACATTCG AAGACGACGA AGGGGCGTAT 
AATCAAAGCG ATGCACTGGG CTTCATCAAG CTGAACGCCC TGCGTCTGCG TCTGGGCGCG 
CAGATCGGAC GGCGCGGCGG CGCGCTGTAG

Protein sequence

MAVKDVKKVV LAYSGGLDTS VILRWLQTTY GCEVVTFTAD LGQGEELEPA RKKAEMFGVK 
EIFVEDLRET FVKDFVFPMF RANTLYEGQY LLGTSIARPL IAQRQIEIAE AVGADAVAHG 
ATGKGNDQVR FELAYYALKP DVTVISPWRE WDLTSRTRLL AFAEEHQIPI AKDKRGEAPF 
SVDANLLHSS SEGKLLEDPA VAPDEIVFQR TISPEAAPDV ATEIAIDFVS GDPVALNGVT 
LSPATLLARL NELGKANGIG RLDLVENRFV GMKSRGIYET PGGTILLAAH RSMETITLDR 
EAGHLKDSLM PRYAELIYNG FWFSPERRML QALIDESQHS VTGRVRLKLY KGNVICVGRE 
SPHSLYDTRV VTFEDDEGAY NQSDALGFIK LNALRLRLGA QIGRRGGAL