Gene Gura_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3988
Symbol
ID	5164793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4632191
End bp	4633309
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	55%
IMG OID	640551466
Product	hypothetical protein
Protein accession	YP_001232705
Protein GI	148265999
COG category	[S] Function unknown
COG ID	[COG3323] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR00486] dinuclear metal center protein, YbgI/SA1388 family

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACTC CCAAGGTCTC AGACATAGTT GGAATCATTA ATAAATTCGC TCCATTCGGC 
CATGCTGAAG AGTGGGACAA TGTGGGGTTG CAGGTGGGAA ATCCCGCTGC CGCGGCCGGG 
AAAATCATGG TGGCGCTCGA TCCCTGTAAA GCTGCCGTTG AAGCTGCCGT TGCAGATAAA 
TGCCAACTCC TGCTCACCCA CCACCCTTTG ATCTTCGCAC CGCTCAAAAA AATTTCCGTC 
AACGACCCCA CCGGCTATCT TGTTTCGTAT GCACTGAAAA ATGACCTGTC GGTTGTGTCC 
TTGCACACCA ACTATGATGT GGCAGATGGC GGGTTGAACG ATCTACTCGC TGAACGCCTG 
GGACTGGAGA TGGGTGAGCC TCTCAGGGTT ACCGGCTCGG AAGAGTTGGT CAAGCTGAGC 
GTGTTCGTTC CCAAAGGCCA CGAGGAGCGA GTGCTGGAGG CGCTGTTCAG GTTCAGCGGC 
GTTATGGGCA ATTACCGGGA TTGTTCGTTT CAAACCGGCG GCACGGGAAC TTTCACGCCG 
CTGGCAGGCG CCCAACCTTT TCTTGGAAAG GTCGGGGTTC GCGAGCATGT GGAAGAAACC 
CGCCTTGAGG TGCTTATTCC CAAGGAGAAC TTGCCCGCAG CGCTTAACGC GTTGCTGTCC 
GCCCACCCCT ACGAAGAGCC TGCCTACGAT CTCTACCCCC TGTTGAACAA GGGGAATGTT 
CGGGGGCTGG GGAGGCTTTG CAGGCTTAAA GAAGAAACTA CGCTGGGTGA CCTGGTTGCA 
TTGGTCAAGG AACGGCTTAC CCTTGCCGGG GCCCGATTCG TCGGGGACAG TGGCAGCCGG 
GTGAAAAAGG TCGCCATCTG CGGCGGAAGC GGGGCTTCGT TGCTCAAAAA CGCCTTCCGC 
CAGGGGGCTG ATGTCCTGAT AACGGGTGAT GTAAAATATC ACGATGCCCG GGATGCAGAG 
TCCCTCGGAC TGGCCTTGAT TGATGCCGGG CATTTTGCCA CGGAAATACT CATGGTGGAG 
GGGGTGGCGG CCAAAGTTGC CCGTGAGTTG CTGGAAAAAG GATATGGTGC AGATGTTGTT 
GCTTACAAGG AAGAGAGAGA GCCTTTTAAT TATGCGTAG

Protein sequence

MKTPKVSDIV GIINKFAPFG HAEEWDNVGL QVGNPAAAAG KIMVALDPCK AAVEAAVADK 
CQLLLTHHPL IFAPLKKISV NDPTGYLVSY ALKNDLSVVS LHTNYDVADG GLNDLLAERL 
GLEMGEPLRV TGSEELVKLS VFVPKGHEER VLEALFRFSG VMGNYRDCSF QTGGTGTFTP 
LAGAQPFLGK VGVREHVEET RLEVLIPKEN LPAALNALLS AHPYEEPAYD LYPLLNKGNV 
RGLGRLCRLK EETTLGDLVA LVKERLTLAG ARFVGDSGSR VKKVAICGGS GASLLKNAFR 
QGADVLITGD VKYHDARDAE SLGLALIDAG HFATEILMVE GVAAKVAREL LEKGYGADVV 
AYKEEREPFN YA