Gene Gdia_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2014
Symbol
ID	6975440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2235257
End bp	2236312
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	643391543
Product	Threonine aldolase
Protein accession	YP_002276389
Protein GI	209544160
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.316829
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAGAGC AGATACGCAA AAATTTCAGC AGCGACAACG TCGTTCCGGC CTGCCCTGCC 
GTGATGTCCG CCCTGATGGC GGCCAACGAG GGCGCCGCCC CCGCCTACGG CGCCGACGCC 
TGGACCGCGC GCCTGCAGCA GGTGGCGGCG GATGTCTTCC AGCACGCGGT CCAGGTCTTT 
CCCGTCACCA CCGGCACGGC GGCGAACGCG CTGGCGCTGG CGGCGATAAC CCCACCCTAT 
GGCGCGGTCC TGTGCGACGA GAGCGCGCAT ATCGTCCAGT CCGAATGCGG GGCGCCCGAT 
TTCTATACCG GCGGCGCGCG GCTGCTGACG ATCCCGTCCG AAGACGGGCG CATGGACCCC 
GCTGCCCTGT CCTATGTGCT GGACCGCCAC CCGGCTTCCA ACGTGCAGGA CAACCTGCCG 
ACGACGCTGA GCCTGACGCA GGCCACGGAA TGGGGCACCG TCTACGACCC GGCGCGGATC 
GCGGACCTGA CGGCGCGGGC GCGCGCCCGG GGCCTGGCGG TGCATCTGGA CGGCGCACGG 
CTGGCCAACG CCATCGTCCA TCTGGGATGC ACGCCCGCCG AGGCGACATG GAAGGCCGGG 
ATCGACGTGC TGGCGCTGGG CGCGACCAAG AACGGCGCGA TGGCGGCCGA AGCCGTGATC 
ATCTTCGACC CCGCGCGGGC CGAGCAGTTC GCCCGGCGCC GCAAGCGCGG CGGCCATGGC 
TGGTCCAAGC AGCGCTTCCT CAGCGCACAG TTGCTGGCCT GCCTGGAAGA CGATCTGTGG 
CTGAACAACG CGCGGCAGGC CAACGCCATG GCGCACCGGC TGGCAGGCGG CCTGTTCCGC 
CACCCCGGCG CCCGCCTGGT CTATGAAACC CAGGCCAACG AGATCTTCGT CATGCTGCCC 
GACCGGGCGA TCGCGCACCT GCGCGCGGCA GGGTTCGTCT TCCGCGACTG GCCCACCCCG 
CTGGGCGTGG AGGGGACCGT CGTGCGGCTG GTCACCAGTT ATTATACGCG CGTGGCGGAT 
GTGGACGCGT TCCTGGCGAC CCTGGCGGAA GTATAA

Protein sequence

MVEQIRKNFS SDNVVPACPA VMSALMAANE GAAPAYGADA WTARLQQVAA DVFQHAVQVF 
PVTTGTAANA LALAAITPPY GAVLCDESAH IVQSECGAPD FYTGGARLLT IPSEDGRMDP 
AALSYVLDRH PASNVQDNLP TTLSLTQATE WGTVYDPARI ADLTARARAR GLAVHLDGAR 
LANAIVHLGC TPAEATWKAG IDVLALGATK NGAMAAEAVI IFDPARAEQF ARRRKRGGHG 
WSKQRFLSAQ LLACLEDDLW LNNARQANAM AHRLAGGLFR HPGARLVYET QANEIFVMLP 
DRAIAHLRAA GFVFRDWPTP LGVEGTVVRL VTSYYTRVAD VDAFLATLAE V