Gene Gdia_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1054
Symbol
ID	6974451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1180468
End bp	1181844
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	53%
IMG OID	643390576
Product	transposase IS1182 family protein
Protein accession	YP_002275452
Protein GI	209543223
COG category	[L] Replication, recombination and repair
COG ID	[COG3666] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.61591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGGTG ATCGAACGAA AATACAGGAG GCACTGTTCT ACGAGTTCCG TCTTGAAGAT 
CATGTGCCAG CTGGCCACCT TTTGCGTTCA ATTGATCGCT TTGTCGATCT GGACGGCCTG 
CGTGAGCATC TTCGCCCATT TTACAGCGGC ACGGGGCGGC CTTCAATCGA TCCCGAGCTG 
ATCATCAGGA TGTTAATCGT TGGCTACGTG ATGGGTATTC GATCCGAGCG ACGGCTATGT 
GAAGAAGTCC ATCTTAACCT GGCCTACCGG TGGTTCTGTG GTCTTGGTCT CAACGGCCCT 
GTGCCTGATC ATTCGACATT CTCGAAAAAC CGGCACGGAC GCTTCCGGGA GAGTGATCTG 
CTTCGCCAAA TGTTCGAAAT GACCGTCCGG CAGTGCATCG CCAAGGGACT GGTGGGCGGT 
GAAGGCTTTG CGGTCGATGC CAGTACGATC AAGGCCGACG CTAATCGGCA GCGCAGTGTT 
CCGAGCCCAG ATAAACTGCC GATCGAGGTG GCCCAACGTG CTGTGCGGGA GTATTTCTCG 
GTGCTGGACG ATGCTGCATT TGGGTCTGCT ACGCCCGTGC AACCAAAATA TATCTCTCCG 
GTCGATCCTG CTGCACGTTG GAACGCTGCA AGCGGTGGCC TTGCTTATTA TGCCTACTGC 
ACAAATTACC TCATTGACCT TAAATCGGCT GTCATCATGG ATGTAGAAAC CACGACAGCC 
ATCCGGCAGG CCGAGGTTAC GGCGCAACGC AGAATGATAG AGCGTACGCA GGAAACATTT 
GGAATATGGC CCGAAAGGCT TGCTGCGGAT ACAGCTTATG GATCCGCAGA AAATCTTGCG 
TGGCTGGTTC ATGAGCGTGG CATAGAACCT CACATTCCGG TCTTCGACAA ATCTGCCCGG 
CAGGACGGGA CTTTCGAACG TCGAGATTTC ACATATGACC ACGTGCACGA TCTTTACATC 
TGTCCTGGAG GACAGCAACT GAAGCAGCAG TGGCGCAAGA TCAACTCGGA TCAACCAAAT 
GCCCCTCCCG ACAACCTACT TCGATACCGT TCGTCGAAAC TGGCGTGCGA CGTATGCACT 
CTCAAACCAA AATGCTGCCC TAATCAGCCC AATCGTAAGG TTCTGCGCTC TATTCATGAA 
GGCGCTCGTG ATATGGCCCG CGACATTGCT TTAACCGACG CCTATATTAT CTCCAGACGA 
GAACGAAAGA AGGTCGAAAT GCTATTTGCT CACCTCAAGC GCATTTTGAA GATCGATCGG 
TTGAGGCTCA GAGGACCAAA CGGCGCCCGT GATGAGTTCC ATCTCGCCGC AGCTGCCCAA 
AATCTCCGCA AAATGGCGAA ACTGATACCT CCCGGAGTGC CTGCCTTATC CACCTGA

Protein sequence

MMGDRTKIQE ALFYEFRLED HVPAGHLLRS IDRFVDLDGL REHLRPFYSG TGRPSIDPEL 
IIRMLIVGYV MGIRSERRLC EEVHLNLAYR WFCGLGLNGP VPDHSTFSKN RHGRFRESDL 
LRQMFEMTVR QCIAKGLVGG EGFAVDASTI KADANRQRSV PSPDKLPIEV AQRAVREYFS 
VLDDAAFGSA TPVQPKYISP VDPAARWNAA SGGLAYYAYC TNYLIDLKSA VIMDVETTTA 
IRQAEVTAQR RMIERTQETF GIWPERLAAD TAYGSAENLA WLVHERGIEP HIPVFDKSAR 
QDGTFERRDF TYDHVHDLYI CPGGQQLKQQ WRKINSDQPN APPDNLLRYR SSKLACDVCT 
LKPKCCPNQP NRKVLRSIHE GARDMARDIA LTDAYIISRR ERKKVEMLFA HLKRILKIDR 
LRLRGPNGAR DEFHLAAAAQ NLRKMAKLIP PGVPALST