Gene Gdia_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2110
Symbol
ID	6975537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2336991
End bp	2338019
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	643391639
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_002276484
Protein GI	209544255
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01296] aspartate-semialdehyde dehydrogenase (peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATACC GCGTTGCGGT CGTCGGCGCC ACGGGCGCCG TCGGGCGGGA AATGCTCAAG 
ACGCTGGCCG AACGCGCGTT TCCGATAGAC GAGATCGTCG CCCTGGCCTC GGCCCGATCG 
GCGGGGCAGG AGGTCTCGTT CGGCGACAAG ACGGTGCTGA AGGTGCAGAA CCTGGAGCAT 
TTCGACTTCA CCGGCTGGGA CATCGCCCTG TTCTCGCCCG GGGCGTCGGT TTCGGCGGTG 
CATGCGCCGC GCGCGGCCAA GGCCGGATGC ATCGTCATCG ACAACACGTC GCATTTCCGC 
ATGGAACACG ACGTGCCGCT GGTGGTGCCC GAGGTCAACC CGAACGCGCT GAAGCGGGCG 
CGGCGCGGCA TCATCGCCAA CCCGAACTGC TCGACCATCC AGATGGTGGT GGCGCTGAAG 
CCGCTGCACG ACCTGTTCAC CATCCGCCGC GTCGTGGTGG CCACGTACCA GGCGGTGGCC 
GGCGCGGGCA AGGAAGGCAT GGACGAACTG TTCGCCCAGT CGCGCGCCAG CTTCGTGGGC 
GACCCGCTGA AGGCCGAACA GTTCACCAAG CAGATCGCCT TCAACTGCAT TCCCCATATC 
GACCGTTTCA TGGATGACGG CGCGACCAAG GAGGAATGGA AGATGACGGC CGAGACCCGC 
AAAATCCTTG ACCCTGACAT CTCGGTTTTC GCTACCTGCG TGCGCGTGCC GGTCTTCATC 
GGCCATTCCG AGGCCATCAC GGTCGAGTTC GAGGAACCCG TGGACCTGGA GCGCGCGCGG 
GAGGCCCTGC GCGAGGCGCC GGGCGTCATC CTGCACGACC AGCGCGAGGA TGGCGGCTAC 
GTCACGCCGA CAGAATGTGT TGGTGAGGAC GCAACTTACG TGTCGCGCCT GCGGATCGAC 
CCGACCGTAC CCAACGGCCT GGCCTTCTGG TGCGTGGCGG ACAATCTGCG CAAGGGGGCC 
GCGCTGAATG CAGTACAGAT CGCGGAAACC ATGATCGCGC TGGACCTGAT TCACCACAAG 
GCAGCCTGA

Protein sequence

MGYRVAVVGA TGAVGREMLK TLAERAFPID EIVALASARS AGQEVSFGDK TVLKVQNLEH 
FDFTGWDIAL FSPGASVSAV HAPRAAKAGC IVIDNTSHFR MEHDVPLVVP EVNPNALKRA 
RRGIIANPNC STIQMVVALK PLHDLFTIRR VVVATYQAVA GAGKEGMDEL FAQSRASFVG 
DPLKAEQFTK QIAFNCIPHI DRFMDDGATK EEWKMTAETR KILDPDISVF ATCVRVPVFI 
GHSEAITVEF EEPVDLERAR EALREAPGVI LHDQREDGGY VTPTECVGED ATYVSRLRID 
PTVPNGLAFW CVADNLRKGA ALNAVQIAET MIALDLIHHK AA