Gene GSU1586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1586
Symbol	nusA
ID	2687296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1738694
End bp	1739851
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	59%
IMG OID	637126266
Product	transcription elongation factor NusA
Protein accession	NP_952637
Protein GI	39996686
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00876176
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAACGA CCTTCAACCT CAAGCACATT ATTGACCAGA TCGTCAAGGA GAAGGGGATT 
GACCGGCACA TCGTCGTGGA AGCCCTGGAG CAGGCGGTAC TCACCGCTGC GAACAAGAAG 
TTCCGCAATA CTCGTGATCT TGAGGCCCAC TATAACCCGG AAGTTGGCGA AGTTGAGCTC 
TTTGAGTTCG TTACCGTGGT CGACGAGGTT CAGGATTCCT ACAAGGAAAT CGACATGGAA 
GAGGCCCGGG AGATCGACCC TGACGTGGAA GTGGGCGATT CTCTCGGTAT GAAGCTGGAT 
GCAAGCGGTT TTACCCGTAT CGCCGCCCAG ACCGCCAAGC AGGTCATCAT CCAGAAGGTG 
CGCGAGGCGG AGCGGGAAAC TATTTTCAAC GAGTTCAAGG ACCGGATCGG CGAACTGGTG 
ACCGGCGTTG TGCGCCGCTT TGAAAAAGGT GATCTGGTAA TCGATCTCGG GCGCGCCGAA 
GCGGTGCTTT CCCATAAGGA GCAGGCGCCG CGCGAGGTGT ATCGCCAGGG TGACCGCGTT 
AAGACTCTGA TCACCGACAT CCGGATGACC CCAAAGGGGC CCCAGATCGT TCTGTCGCGT 
ACCCATCCCG GCGTCCTTGC CAAGCTTTTC GAGGCGGAGG TTCCGGAGAT CGCCGAAGGG 
ATCGTGGAGA TCAAGGCCGT TGTACGTGAG CCGGGCAGCC GGGCCAAGAT CGCCGTCTAC 
TCCCATGATT CCGATGTGGA TCCCGTTGGG GCCTGCGTGG GTATGCGGGG TAGCCGCGTG 
CAGAATGTGG TGTCCGAGCT GAGGGGTGAA AAGATCGATA TCATCCCCTG GTCCGATGAC 
GCGGCACGCT TTGCGTGCAA TGCGCTGCAA CCGGCCGTGG TGTCGAAGGT GTACATTGAC 
GACGAGAACC GCTCCATGGA GATAATCGTC GCCGACGACC AACTGTCGCT GGCTATCGGT 
AAAAAAGGGC AGAACGTGCG GCTTGCCGCA AAGCTTACCG GCTGGCGCAT CGACATCAAG 
AGCGAAACCA CTGCTGCCGA GGCGGAACTG CTCCAGTATT CCTCCTATGA TGGGGCCACC 
GAAGAGGTTG CTGAAGAGGC CGCCCAAGCC GTTGAGACCG AAGGCGAAGC GGTTGCAGAG 
GAGCAGGTGG AAGCATAG

Protein sequence

METTFNLKHI IDQIVKEKGI DRHIVVEALE QAVLTAANKK FRNTRDLEAH YNPEVGEVEL 
FEFVTVVDEV QDSYKEIDME EAREIDPDVE VGDSLGMKLD ASGFTRIAAQ TAKQVIIQKV 
REAERETIFN EFKDRIGELV TGVVRRFEKG DLVIDLGRAE AVLSHKEQAP REVYRQGDRV 
KTLITDIRMT PKGPQIVLSR THPGVLAKLF EAEVPEIAEG IVEIKAVVRE PGSRAKIAVY 
SHDSDVDPVG ACVGMRGSRV QNVVSELRGE KIDIIPWSDD AARFACNALQ PAVVSKVYID 
DENRSMEIIV ADDQLSLAIG KKGQNVRLAA KLTGWRIDIK SETTAAEAEL LQYSSYDGAT 
EEVAEEAAQA VETEGEAVAE EQVEA