Gene Gura_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_1920
Symbol
ID	5165515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	2224614
End bp	2225645
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	41%
IMG OID	640549414
Product	NHL repeat-containing protein
Protein accession	YP_001230683
Protein GI	148263977
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00542747
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTACTCCA GACTGTTTCT TGTATTAGTG TTTTTTACCA TTTTCGGCTG TACCACTGTT 
GAACCACTCG TACTGCGAGA TACTAAGATT GATCTTGCAT GGCCACTCCC TCCAAACTCC 
CCCCGGATAA GATTCCTCCG CACGATAAAT GGTCCAGATA ATATTATTAC CGCTCCTGGA 
AAGGTGCAGC ATTTATTCGA GATGGTAACA GGTGAAAGTA GACTTAAGGT TGATTTTGAT 
GCGCCCTATG GCATCACCGG AGATGGAGAA TCTGTTCTAT ATATAGCAGA TACAGGTGTC 
GGTCTTGTTC ATAGGTACGA TTTAATCAAC AGAGAGGTTG GTTATATTGT TCAAGCAGGA 
GATGAAGAAA TGTCCAGCCC CGTTGGAGTG GCTGTTGATG GTGAAAAAAA TCTTTATGTT 
GCTGATTCTG TGAATGCTAA AGTCTACAAA TATAATAAGA AGGGACAGTT TCTTAGGGAA 
TTAAAATATG AAGCAGGATT TAAAAGGCCT GCCGGTATAG CGGTGAATAG CCGAAATGAA 
AAATTTATTG TGGATGTGCT GGCACATAAA TTGTATATTT TTGGTGAGGA TGATCGATTT 
ATACGTGACT TTCCCAAAAT GAAGAAGGGC GAAGAGCTTA ATTATCCGTC TAATGTTGCT 
ATCGACCGTG CAGATAATGT TTATGTCACC GATTCGATGA ATTTTACCAT TAAGGTGTAC 
AACCGTGAAG GGGATCTGCA AAGGACTATC GGTCAAATTG GCGATTCACC CGGTTCTTTC 
GCGAGACCTA AAGGCATTGC GGTAGACAGC GATCAACAAA TATATGTGGT TGATGCAACC 
CTTGACAATT TTCAGATATT CAATCAAAAA GGAAATCTTC TGCAACTCAT AGGCAAGAAC 
GGTGGAGGTG CTGGCGAATT TTATCTGCCG AGCGGCATAT ATATTGACAA GCATGATCGT 
ATATTTGTTA CCGACACCTA TAATCGGAGA ATTCAGGTAT TCCAATACCT GAAAGAAGGT 
GGGAAACTGT GA

Protein sequence

MYSRLFLVLV FFTIFGCTTV EPLVLRDTKI DLAWPLPPNS PRIRFLRTIN GPDNIITAPG 
KVQHLFEMVT GESRLKVDFD APYGITGDGE SVLYIADTGV GLVHRYDLIN REVGYIVQAG 
DEEMSSPVGV AVDGEKNLYV ADSVNAKVYK YNKKGQFLRE LKYEAGFKRP AGIAVNSRNE 
KFIVDVLAHK LYIFGEDDRF IRDFPKMKKG EELNYPSNVA IDRADNVYVT DSMNFTIKVY 
NREGDLQRTI GQIGDSPGSF ARPKGIAVDS DQQIYVVDAT LDNFQIFNQK GNLLQLIGKN 
GGGAGEFYLP SGIYIDKHDR IFVTDTYNRR IQVFQYLKEG GKL