Gene Gdia_2254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2254
Symbol
ID	6975683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2502460
End bp	2503476
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	72%
IMG OID	643391781
Product	Thioredoxin domain
Protein accession	YP_002276624
Protein GI	209544395
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3118] Thioredoxin domain-containing protein
TIGRFAM ID	[TIGR01068] thioredoxin

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.708544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.526752
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACA TCATCGGTCA GTCCCGCGGC GGCCAGCGCG CTACCGGCGG CCTGGTGGAC 
GAGGCAGGCG TTCCCGCCGC GCCGTCGGGG ATGGCCGGAG CGCCGGCCGG GCCCGGCGGG 
AATGGTGCGA TGATCGTCGA CGGCACCCAG GACACCTTCA TGCAGGATGT CCTGGAGGCC 
AGCCGTACCC TGCCGGTCCT GGTCGATTTC TGGGCCACCT GGTGCGGGCC GTGCCGCCAG 
TTGACCCCGG TGCTGGAAAA GATCGTCCGG TCGGCCGGCG GCCGCGTGAA GCTGGTCAAG 
ATCGATGTCG ACGCCAACCG GGCCCTGGCC CAGCAACTGA CCCAGGTCGG GCTGCCGCTG 
CAGTCCATCC CGCTGGTGGC CGCCTTCTGG CAGGGGCAGA TCCTGGACCT GTTCCAGGGC 
GCGCAGCCGG AAAGCGAGAT CAAGCGCTTC GTCGAAGGAC TGCTGAAGGC CGCGGGCGGC 
GGCAGCATGC CGGCGGCGGA CCTGATCGTC GCGGCCCGCG CGGCGCTGGA GGCCGGCAGC 
GCCGAGGAAG CGGCCGGCCT GTATGCCCAG ACCCTGGAGA TCGAACCCGA AAACGCCGCC 
GCCTGGGGCG GCCTGGTGCG GGCGCTGATC GTGATGGGGG ACGAGGACGC CGCCGAGGCC 
GCACTGGCCG ACGTGCCGGC CAGGATTGCC GACCATGCCG AGATCACCGG CGCCCGCGCC 
GCGCTGGACC TGAAGCGCGA GGGCCGCAAG GCCGCCGAGG CATCCGAAGG GCTGCGCCGG 
CGGCTGGCCG CGAATCCGGC GGACCACGAG GCCCGCTACG AACTGGCCGC CGCCCTGAAC 
GCGGCCGGCC ACCGGCAGGA AGCCGCCGAC GAACTGCTGA CCATCATGCG CCAGGACCGT 
GCCTGGAACG ACGATGCGGC GCGGCTGCAA TTGATCCGGC TGTTCGAGTC CTGGGGCCAT 
GACGACCCGG CGACCCTGCA GGCCCGGCGG CGTATGTCCG CGCTGCTGTT TTCATGA

Protein sequence

MDYIIGQSRG GQRATGGLVD EAGVPAAPSG MAGAPAGPGG NGAMIVDGTQ DTFMQDVLEA 
SRTLPVLVDF WATWCGPCRQ LTPVLEKIVR SAGGRVKLVK IDVDANRALA QQLTQVGLPL 
QSIPLVAAFW QGQILDLFQG AQPESEIKRF VEGLLKAAGG GSMPAADLIV AARAALEAGS 
AEEAAGLYAQ TLEIEPENAA AWGGLVRALI VMGDEDAAEA ALADVPARIA DHAEITGARA 
ALDLKREGRK AAEASEGLRR RLAANPADHE ARYELAAALN AAGHRQEAAD ELLTIMRQDR 
AWNDDAARLQ LIRLFESWGH DDPATLQARR RMSALLFS