Gene Gura_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_1668
Symbol
ID	5164143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	1934620
End bp	1935906
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	52%
IMG OID	640549164
Product	transposase
Protein accession	YP_001230436
Protein GI	148263730
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000920779
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACAG AGATCGTTTT CCCCGGCATC GAAGAATATA TGGCTCCCTA TTATGGCTAT 
TTCCATCGGT CAGAGAGCCG TGAACTGGCA GAATGTTACT TGGCCGGCCT GCTCATGGAC 
GGTGAGCGCA AGTCAGTTGA ACCCATGTCA GAGAAGGTAA ACGCATCTGA ACGAAGTATG 
CAGCGCCTCC TTTCGACTGC CAAATGGGAC GATCAACTTG TTGCTGAGCA ATTCCGCCGT 
TCCATGCTTG ACGTCACTTC CGACCCGCAG GGGATCCTGG TTCTTGATGA TACCGGGTTC 
CCTAAGAAAG GGTACGACAG TGTATGTGTT GCCCGGCAAT ACTGCGGTGC ATCAGGCAAG 
ACTGACAACT GTCAGATTGG CGTAAGCATG ACGTATGTCG GCAGAGATGT CGCCTGGCCA 
TATGCCATGG AACTGTTCGT CCCGGAATCC TGGGATCAGC AAAATGATGA TTGCACCGCA 
AAGCGTAAAA AGGCTCACAT GCCGGAGTCA GTGCACCATA AGTCAAAATG GCGCATGGCA 
CTTGATTTTG TTGACCTGGC CCGAAAAGAC AATGTTCCCC ATCGTGCAGT CCTTGCTGAC 
AGCTGGTATG GCAACATTCC GGAGTTTCGC AAGGAGCTTG AGTCCCGCAG TGAAAATTAC 
ATCCTGGGAG CTTACTCCAA CACCCCGGTA TTTCTTGAGG AGCCGGTCTT TGAAATTGCG 
CCAGTCAAAG AGCATAAGCG AGGGCGTCCA CGAACTCGCC CTAAGGTAGT CTCCACAAAC 
CCCGAACCGG TCAAGCTGTC GGTACTGGGC GAAAGCATTG CCGATGATGC ATGGCAACGG 
CTAGAATTGA GGCTCAATTC CAAGGACAAG CCACTTGTTG CAGAGGCCGT CTCAATGAGA 
GTGTGGCCGG CTCACGGATG GCGGCAGGGC AATCATCATG AACAAGTCTG GCTCCTGATA 
GAGCGCCGCC CCCTGAACCT GGGTGGATAC GAGCTTCGCT ATTTCTTCAG CAATATGCCG 
CAGCATCTGG CAACGATTGA CCTTGCCCGC CTCTACCATG AACGTTATTG GATAGAGCAT 
GGCTATCAAC AGCTAAAGGA AGAGCTTGGC CTTGATCACC ATGAAGGGCG CTCATGGAGC 
GGATGGCATC GACATGTGCT CCTGACGTCC CTGGCATATG GCTATCTGAC ACTGTTGCGT 
TTGCAGCAAA AAAAACAGAA GAGTGCGACA GCGCGGAGCA ACTGGATTCA GAAAAAATCG 
ACACTGGCCA ACGACGCTTT GTTCTGA

Protein sequence

MTTEIVFPGI EEYMAPYYGY FHRSESRELA ECYLAGLLMD GERKSVEPMS EKVNASERSM 
QRLLSTAKWD DQLVAEQFRR SMLDVTSDPQ GILVLDDTGF PKKGYDSVCV ARQYCGASGK 
TDNCQIGVSM TYVGRDVAWP YAMELFVPES WDQQNDDCTA KRKKAHMPES VHHKSKWRMA 
LDFVDLARKD NVPHRAVLAD SWYGNIPEFR KELESRSENY ILGAYSNTPV FLEEPVFEIA 
PVKEHKRGRP RTRPKVVSTN PEPVKLSVLG ESIADDAWQR LELRLNSKDK PLVAEAVSMR 
VWPAHGWRQG NHHEQVWLLI ERRPLNLGGY ELRYFFSNMP QHLATIDLAR LYHERYWIEH 
GYQQLKEELG LDHHEGRSWS GWHRHVLLTS LAYGYLTLLR LQQKKQKSAT ARSNWIQKKS 
TLANDALF