Gene Gura_4065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4065
Symbol	rho
ID	5165085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4722351
End bp	4723598
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	55%
IMG OID	640551544
Product	transcription termination factor Rho
Protein accession	YP_001232782
Protein GI	148266076
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000187673
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTAC AAGAATTAAA GGGTAAAAAA ATCAATGAGC TGACCGCTAT TGCCAAGGGT 
CTGAATATTG AGGGCGCTTC CAGTCTGCGC AAGCAGGACC TGATTTTTGC CATCCTCAAT 
GCCCAGACCG AGAAAAACGG CATGATCTTT GGCGAGGGTG TGCTTGAAAC CCTGCCGGAT 
GGATTTGGTT TCTTGAGGGC GCCGGATTAC AACTATCTGC CGGGGCCGGA CGACATCTAT 
GTCAGCCCAA GCCAGATCCG CCGTTTCAAC CTTCACACAG GCGATACCGT TTCCGGCCAG 
ATCAGGCCTC CCAAGGAGGG TGAGCGTTAT TTCGCCCTGC TCAAGGTTGA ATCTGTCAAC 
CATGAATCGC CGGATGTGGC GAGGGATAAG ATCCTCTTCG ACAACCTGAC GCCACTTTAT 
CCCGAAGAGA AGCTGAAGCT TGAGACAACG CCCGACAATA TGCCGATGCG GGTGGTGGAG 
CTGATAGCGC CCATCGGCAA GGGGCAGCGC GGTCTGATCG TCGCACCGCC CCGCACCGGC 
AAGACCATGC TGATCCAGAA TATCGCCAAC TCCATTGCCG AAAACCACCC CGAAGTATTC 
CTTATCGTCC TTCTCATCGA TGAACGTCCG GAAGAGGTGA CCGACATGCA GCGCTCGGTC 
AACGGAGAGG TGATTTCCTC CACCTTCGAT GAGCCCGCCT CGCGTCATAT CCAGGTGGCG 
GAGATGGTAA TCGAGAAGGC CAAACGGCTT GTCGAGCACA AGCGGGATGT GGTGATCCTC 
CTTGACTCCA TTACCCGTTT GGCCCGTGCC TACAATACGG TCATTCCCCC TTCCGGCAAA 
ATCCTTTCCG GCGGCGTCGA CTCCAATGCC CTGCACAAAC CGAAGCGCTT CTTCGGTGCA 
GCCCGCAACA TCGAAGAGGG CGGCTCGCTC ACGATCATCG CCACTGCCCT GGTCGATACC 
GGCAGCAAGA TGGATGAGGT CATCTTCGAA GAGTTCAAAG GGACCGGCAA CATGGAACTT 
CATCTCGACC GCAAGCTGGT CGAGAAGCGT ACCTTCCCGG CTATCGACAT TAACAAGTCC 
GGTACCCGCA AGGAGGAACT TCTCATCGAG AAAAGCGCCC TCAACCGGAT CTGGATTCTG 
CGCAAGGTGC TCCATCCCAT GAATGTGGTG GACAGTATGG AATTCCTCAT CTCCAAGCTT 
GAGGGGACCA AGGGTAACCA GGCGTTCCTT GATTCCATGA GTAAGTGA

Protein sequence

MNLQELKGKK INELTAIAKG LNIEGASSLR KQDLIFAILN AQTEKNGMIF GEGVLETLPD 
GFGFLRAPDY NYLPGPDDIY VSPSQIRRFN LHTGDTVSGQ IRPPKEGERY FALLKVESVN 
HESPDVARDK ILFDNLTPLY PEEKLKLETT PDNMPMRVVE LIAPIGKGQR GLIVAPPRTG 
KTMLIQNIAN SIAENHPEVF LIVLLIDERP EEVTDMQRSV NGEVISSTFD EPASRHIQVA 
EMVIEKAKRL VEHKRDVVIL LDSITRLARA YNTVIPPSGK ILSGGVDSNA LHKPKRFFGA 
ARNIEEGGSL TIIATALVDT GSKMDEVIFE EFKGTGNMEL HLDRKLVEKR TFPAIDINKS 
GTRKEELLIE KSALNRIWIL RKVLHPMNVV DSMEFLISKL EGTKGNQAFL DSMSK