Gene Gdia_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1661
Symbol
ID	6975077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1851749
End bp	1852888
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	60%
IMG OID	643391194
Product	transposase IS110 family protein
Protein accession	YP_002276051
Protein GI	209543822
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCCG AGAACGCCAT TCACATTGCC ATCGAACTCA GCGTTTCCTC CTGGCTTGTC 
GCGGTAAAGA CTATCTCGGG AGCCACGAAA TCCCGATTGC ATCGCCTCGA AGGTGGAGAC 
GCCTCAGGGC TGCTGAAATT GATCGCGGAG CTTCAAACGC GCGCGTCGAC CCAGCCGGGT 
GATGTCGCGG AGGTGTCATG CTGTTTCGAG GCCGGCCGCG ATGGCTTCTG GCTGTATCGT 
TTGCTGACAG CGCACGGCAT CGCCGCGTAT GTGCTTGAGC CCACGAGCAT TCTGGTCAAT 
CGTCGCGCAC GTCGGGCCAA GACGGACCGT CTCGACGCGG AAGGCATGCT GCGTGTTCTT 
GCGGCATGGC TTAATGGTGA TCGCCAGATA TGCAGCATGG TGCGTGTGCC GACGCCCGAC 
GAGGAGGATG CCAAACGTAC ACACCGCGAA CGCGAACACC TTGTTCAGGA AAGGCTGCGT 
ATCGAAAACA GAATAGAGGC GCTGCTGTTT ACCCAGGGCA TCCGGGGTAG ACCGTCGTTA 
CGGTCCTGGG AACGCGACGT CGCCGCGTTG CGCACGGGCG ACGGGCGGGA ACTGCCGCCG 
TTCCTTCGTG CTGAACTCGA CCGCCTGCGT CGTCGGCTTC TCCTGGCGTT GGAACTGATC 
CGAGAACTGG AAACTGAACG GGCCAAGACA CTGGACGCCG CAGCGATGGA TGACCGTGTG 
ACTCAAAAGA TCGTCTCGCT GAAACAGATC CGCGGCATCG GCGAGAATTT CGCTGCCGTT 
CTCGTTCGGG AGGTGTTCTA TCGCCGCTTC GACAACCGTC GCCAACTGGC CAGTTACGTC 
GGCATTACGC CTATGCCTTA TCAAAGTGGC AGCATGGATC GTGATCGAAG CATCAGCCGG 
GCCGGAAACC CGCGAGCGCG GACGGCGATG ATCCAACTCG CCTGGCTTTG GCTACGCTAT 
CAGCCCGCAA GCGGGCTCGC CTCATGGTTT CGTGAGCGCG TCGGCACCTT GAAAGGGCGG 
ACACGCCGCA TTGCGATCGT GGCCATGGCG AGAAAGCTTC TGATTGCGCT TTGGCGCTAT 
GTGGAGACAG GATCGATACC GGACGGTCTC GCATTCGGCA CCGGAACGAC CGCAGAATAG

Protein sequence

MSSENAIHIA IELSVSSWLV AVKTISGATK SRLHRLEGGD ASGLLKLIAE LQTRASTQPG 
DVAEVSCCFE AGRDGFWLYR LLTAHGIAAY VLEPTSILVN RRARRAKTDR LDAEGMLRVL 
AAWLNGDRQI CSMVRVPTPD EEDAKRTHRE REHLVQERLR IENRIEALLF TQGIRGRPSL 
RSWERDVAAL RTGDGRELPP FLRAELDRLR RRLLLALELI RELETERAKT LDAAAMDDRV 
TQKIVSLKQI RGIGENFAAV LVREVFYRRF DNRRQLASYV GITPMPYQSG SMDRDRSISR 
AGNPRARTAM IQLAWLWLRY QPASGLASWF RERVGTLKGR TRRIAIVAMA RKLLIALWRY 
VETGSIPDGL AFGTGTTAE