Gene Gdia_0649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0649
Symbol
ID	6974046
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	739816
End bp	740933
Gene Length	1118 bp
Protein Length	372 aa
Translation table	11
GC content	63%
IMG OID	643390180
Product	transposase IS3 family protein
Protein accession	YP_002275056
Protein GI	209542827
COG category	[L] Replication, recombination and repair
COG ID	[COG2801] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.343729
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAG CGCGATTTAC GCAGGACCAG ATTATCGGGG TCCTGAAAGA GCATCAGGCG 
GGCGCTACGG CTGCGGATCT GTGCCGCAAG CACGGGATCA GTGACGCGAC CTTCTACACC 
TGGCGGTCGA AATACGGCGG GATGGAGGTG TCGGAAGCGC GGCGCCTCAA GGCTCTTGAA 
GAAGAGAACG CGAAGCTGAA GCGGCTTCTG GCGGAGAGCG TGATGGACGT CTCGACGCTG 
AAGGAACTAC TGGCAAAAAA CTCGTGACGC CCGGTTTGCG GCGGGAAGCC GTGACCTGGG 
CGATCCGGGA GAAAGAGTAT TCGCAGCGAC GGGCCTGCCG GCTGATCGGC ATGGACCCGA 
AGACCTGGCG CTATGCGTCA CGCCGCCCGG ATGATGCCGC AGCGCGCGGG CGGCTGCGCG 
AACTGGCTGG GGAGCGACGG CGATTTGGCT ACCGGCGACT GCATATCCTG CTCGGCCGGG 
AAGGAATGAC GATGAACCAC AAGAAGCTGT TCCGGCTGTA TCGCGAAGAG GGGCTGTCGG 
TCCGCAAGCG TGGCGGCCGG AAACGGGCGC TGGGCACGCG CTCGCCGATG ATGCTGCCCG 
ACGGGCCGAA CCAGCGCTGG AGCCTGGATT TCGTCTCGGA TGCATTGAAC AACGGACGGC 
GCTTCCGGGT GCTGACGGTG GTCGACGACT ACACGCGCGA ATGTCTGGCG CTGGTGGCGG 
ACACCTCGTT ATCAGGCGAA CGCCTCGGTC GTGAACTCGA CCGGATCGGC GAGCATCGCG 
GCTGGCCGCT GATGATCGTT AGCGACAATG GCACCGAGAT GACATCGAAC GCGATCCTGG 
CCTGGCAGCA GAAGCGATCG GTGCTGTGGC ACTATATCGC ACCGGGCAAG CCGCAGCAGA 
ACGGGTTCGT CGAGAGCTTC AACGGCCGGT TCCGCGACGA ATGCCTCAAT GAGCATCTGT 
TCCGTAACAT CGCCCACGCT CGGACGGTCA TCGAGGACTG GCGGGCCGAC TACAACGCCG 
TCAGGCCTCA CACCAGCCTC AATGGCATGA CGCCAGAGGC TTTCGCTCAA CACGCCACCA 
AGGCATACAA CAATACACAG ACCCTAACTC AAAACTGA

Protein sequence

MKKARFTQDQ IIGVLKEHQA GATAADLCRK HGISDATFYT WRSKYGGMEV SEARRLKALE 
EENAKLKRLL AESVMDVSTL KELLAKKLVT PGLRREAVTW AIREKEYSQR RACRLIGMDP 
KTWRYASRRP DDAAARGRLR ELAGERRRFG YRRLHILLGR EGMTMNHKKL FRLYREEGLS 
VRKRGGRKRA LGTRSPMMLP DGPNQRWSLD FVSDALNNGR RFRVLTVVDD YTRECLALVA 
DTSLSGERLG RELDRIGEHR GWPLMIVSDN GTEMTSNAIL AWQQKRSVLW HYIAPGKPQQ 
NGFVESFNGR FRDECLNEHL FRNIAHARTV IEDWRADYNA VRPHTSLNGM TPEAFAQHAT 
KAYNNTQTLT QN