Gene GSU2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2119
Symbol
ID	2687742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2337618
End bp	2338979
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	48%
IMG OID	637126811
Product	integrative genetic element Gsu56, integrase
Protein accession	NP_953168
Protein GI	39997217
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAT TTACCGACCG TTACCTCACC TCTCTCAAAC CTCAAGATAA AAAATATGTC 
GTAAGAGAGG GCCGAGGATT CGCGATCCAG GTGCTGCCTT CAGGAACAAA GACATTTATG 
TATATCTTTG AACTGAACAA GCAGAAGGGG TACCTACTGC TCGGCAATTA TCCCGCCATG 
TCCTTGGGTG ATGCCCGGAT AGCTTACAAC GACGCATATA AACTCGTCAA GAACGGCATC 
GATCCACGCG AGGAAAAAAG AACAGCTATC GAGGAACAAT CTCGATTGGC AAATGAGGCT 
AGACTTCAAG CTGAAGCTGC AGCCCTTGCT GCTGAGAAAT TGGAAAAAGA TTCCTTTGAT 
TCCCTGATAG AGGATGAACT CCCCGAAGGA TACACCCCGA TAACCGTAGA ACAGCTCGCT 
GCGATATGGT ACGTCAAATA CTCTAAGGAG AATCATTCAG TTCGATGGCG AGAAACTATC 
CTTAGCGCTA TCAAGACCCA CATCATTCCC GGTATCGGCA AAATGGAAAT TTCCTCTGTC 
AGACACAAGC ATGCTGTTTC TCTCATCGAG CAAATTGCAT CCAAGGTCCC GGGATCGGCT 
CGTAACGTGA TGAAATTTGG CAGACAAATG TTCAAATATG CCTGTCGGCA AGAGTGGGCG 
GAGATTCAGC CGTTCCAGGA GATCACAGCA TCTGTCCCCA AGATTGCCCC CAAAACTGAC 
GACCGGCATC TTGATGACGA CGAAATCGTG AAGGCGTGGA AAGAAATCAG CAAGGGACCA 
AGCTCTACCG AGGTCAAGCG TGCGCTTAAA TTGATTCTGG TAACCGCTCA GCGCCCCGGA 
GAAGTTGCAC AAATTCACCG TGATCAGATC AAGGACAGAT GGTGGACTAT CCCTGCAGAG 
GTTGCTGGCA AAAATGAACG TGAGCACAGA GTCTACTTGA CTGACACTGC TCTGGAGCTG 
ATCGGACAAG GTAAAGGGTA CATCTTCTCA TCTGGCCGAG GGAAAAGAGG CCATATTTCC 
GAGAACACTC TTTCACAAGC CATAAATCGA GGTTATTTGG ACGAAGATGT TGTGAAAGTT 
GTTGGGAACA GAAAAATCAA AGCGCGCAAA GAACCTTACT TCGGGATGAA GCCATGGTCG 
CCGCATGATC TTCGCCGAAC CGCACGCACA AATATGGCAC GAGTTGGCAT TACAGACGAA 
GTTGGCGAAG AAGTCATAAA TCACATCAAG CCAGGCATAG TCGGCGTTTA CAATAAATAT 
CGTTATGACA ATGAGAAAAA GGACGCCCTT TTGAAGTGGG AAGCCTTGTT ACTGAACATT 
CTGTCACCCA AACCGCAGGA TAGTAATGCA GATGGAGAAT AG

Protein sequence

MKQFTDRYLT SLKPQDKKYV VREGRGFAIQ VLPSGTKTFM YIFELNKQKG YLLLGNYPAM 
SLGDARIAYN DAYKLVKNGI DPREEKRTAI EEQSRLANEA RLQAEAAALA AEKLEKDSFD 
SLIEDELPEG YTPITVEQLA AIWYVKYSKE NHSVRWRETI LSAIKTHIIP GIGKMEISSV 
RHKHAVSLIE QIASKVPGSA RNVMKFGRQM FKYACRQEWA EIQPFQEITA SVPKIAPKTD 
DRHLDDDEIV KAWKEISKGP SSTEVKRALK LILVTAQRPG EVAQIHRDQI KDRWWTIPAE 
VAGKNEREHR VYLTDTALEL IGQGKGYIFS SGRGKRGHIS ENTLSQAINR GYLDEDVVKV 
VGNRKIKARK EPYFGMKPWS PHDLRRTART NMARVGITDE VGEEVINHIK PGIVGVYNKY 
RYDNEKKDAL LKWEALLLNI LSPKPQDSNA DGE