Gene GSU2118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2118
Symbol
ID	2687762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2335994
End bp	2337334
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	637126809
Product	integrative genetic element Gsu21, integrase
Protein accession	NP_953167
Protein GI	39997216
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAG TGGGTGAAAA GATCAAGCGT CGGACGTTCT GCTTCGCCAA GACCTTCTAC 
TGGCTGGACG AGAAGACGAA GGCCCACTTC ACGGCGCTGG AGGGAAGCGA CTACAAGCCG 
GAACCGGAGC ACGTCTACTT CGGTGAGTAT TGCGAACAGT GGATGGAGCG GAAGATTCCG 
ACCTTTTCGT CGGTGACGAA GCAAAGGGAT TACCGGGAAG CGCTCACCTC CCGCATCCTG 
CCCTACTTCG GGGAGATGAC CTTCTCCCAG GTTACCGCCA CGGCGGTAGA GACGTTCATT 
GACAATCTAA AGAGAGTAAA CCGTGCCAAA AATCCCAAGA AGACCAAGGG GGCAAAGCCC 
CTGTCGGTGA AACGGGTCAA AAACATCATC GGTCCAATGT CAAAGGTCTG GGAATCGTCC 
TGCAACGACT ACAACTGGAA TCTCCGCGAT CCGTTTTCCG CAGTAACCCA GAAGTACACG 
GAGTTGACTG ACAGGGCGCT TCAGGAAAAA GAGCGGCAGG CCGCTCTGAG GAGTGATGAG 
GAGGAAGATG TCTCGACGAG GGAGATCTTC CTGCTTGAAG AGTGGCAGAT ACTCTGTTCC 
TACATCGATC CCCACTATTA CCCCGTGCTG GAACTGCTGA TGCTGGGGAT GATCGGCTCG 
GAGTTGGAGG CACTGCAAAA GCGGCACATA AAGGGTGGCG TGCTGACAGT CCGCTGTGCG 
GTAGCGAGGG ACCGGAAGGG GATGCGGCAC CTGAAGTTCA AGCCGAAGAA CTGGTATCGC 
AAGCGGGACG TCCCCCTGAC CGGCAGAGTA CAAAGCCTTC TGGAACAGGC GATGGCTACG 
GCGACGAGGG ACGGGGTTGT TACCTTCGCC AACGACATCG CCATCCCGGC CAACCAGTTC 
GTCCTCACCA TGAAGGACGG CAGCCCCTTC AACTACAACT CATTCCGCAA GACGGTGTGG 
AACAAGGCCT TGAAGGCGGC AGGCATGGAG CCTCGGGTTC CTTATGCGGC CCGGCACACT 
CTGGTGCAGT GGTCGCTTCT GATCGGAATG ACCAAGACCC GGCTCGTGGA CCTGATGGGT 
CATTCGACCA AGAAGATGAT CGACGAGGTG TACGGGAGCT ATCGGCAGGG ACTGGTGGAG 
GAGAGGGAGC GGATTCTGGA TTACCTGGGG GAAGACTTCC TCGCCCTGGA AGAGATGAAG 
CTTGCGTTCC CCGAGCGCTA CCGGCGGCGG ATGGCAACGA CGGAGCCGGC CCATGAAACG 
GCGAAAGCCC CGGGCCTTCC CGCCACTTTT GGTCAAAGTT TTGGTCAAAG CCAGGGGCTC 
TATCCGGATA ACTACCCGTA A

Protein sequence

MEKVGEKIKR RTFCFAKTFY WLDEKTKAHF TALEGSDYKP EPEHVYFGEY CEQWMERKIP 
TFSSVTKQRD YREALTSRIL PYFGEMTFSQ VTATAVETFI DNLKRVNRAK NPKKTKGAKP 
LSVKRVKNII GPMSKVWESS CNDYNWNLRD PFSAVTQKYT ELTDRALQEK ERQAALRSDE 
EEDVSTREIF LLEEWQILCS YIDPHYYPVL ELLMLGMIGS ELEALQKRHI KGGVLTVRCA 
VARDRKGMRH LKFKPKNWYR KRDVPLTGRV QSLLEQAMAT ATRDGVVTFA NDIAIPANQF 
VLTMKDGSPF NYNSFRKTVW NKALKAAGME PRVPYAARHT LVQWSLLIGM TKTRLVDLMG 
HSTKKMIDEV YGSYRQGLVE ERERILDYLG EDFLALEEMK LAFPERYRRR MATTEPAHET 
AKAPGLPATF GQSFGQSQGL YPDNYP