Gene Gura_3642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3642
Symbol
ID	5164255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	4271395
End bp	4273029
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	53%
IMG OID	640551126
Product	hypothetical protein
Protein accession	YP_001232368
Protein GI	148265662
COG category	[L] Replication, recombination and repair
COG ID	[COG1315] Predicted polymerase, most proteins contain PALM domain, HD hydrolase domain and Zn-ribbon domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000393022
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAAG AAGCAAAACA GGAGAAGGGA TTAACCTTCC AGATAAGCCC AGACGGCGGC 
AAGTTACTCG CCACGTACGA GCCCGTCGCA CAAAAAGTCC CAATCGACAC TGACTGGGTC 
TGGCAGGCGC TTGATGCTCA AAATTTATCA GACCTGTTCA TTCTTGATGA CGCTCTTTCC 
AATCTGGTAA AGAGGTGCGC CGTTGCCGCA GACCGATTCA CGATGCAGAT CGGGGAACGC 
AGGGATGGCA CGCTGGCATT GACCGTTGCT CCAGATCTGA TGTCGGCGTA TATCACCATC 
ACATCTGCAT ACGGCGGCAA TGCCGTCACC TCCGAGCAGA TACTCCAGGC TCTCCAGGAA 
CAAAAAATTG TCAGCGGGAT TCTCCATGAT GAAATAGAAA AGGCTGTTGG TGAAAGGGAG 
GTCCTGAAAA GGGAAATTGC CAAAGGCCGT TCGCCGCAAC CAGGAGAAGA TTCCCAGTTT 
ATCAGCCTGA TCCCGGAAAT GAGGGAAAGA TGTCCCCTGG CAGACGACAC GGACAACGTT 
GATTACCGCA ATCTGGGCGG CATCGTCAGC GTCAAATCGG GCGACCCTTT GATGCGGCGC 
TATCCGGCGA CCAAAGGGAC GCCTGGCGAA AACATTCTGG GAACTCCGTT ACCAACAACC 
GACGGCAACG ACATAGCATT TACTCCGAAC CTCAGTGGCA CCGTCTTCGC GGAAAACGAC 
AGTGATCTGC TTCTGGCAGC CATTTCCGGG CTACCCGTCC AGGTGGATCA CGGCATCATT 
GTCGAACCGG TCATCAATCT CAAGAATGTC GACCTCTCTT CCGGTAATCT GCACTTCGAA 
GGCACGGTAA ACATCGCCGG TGATGTAAAA GCCGGGATGG AAGTAAAAGC AACGGGTGAC 
ATCATTATCG GCGGCGTCGC CGAAGCCGCA AAGATCGAAG CCGGCGGCAA CATCGAAATA 
AAAGGGGGGG TAATCGGCCA GAGAGAAGTG AGAAACCAAA AAGGCGAACT GAACCCCGAC 
ATTTCATACG TTCATGCCGG CGGCTCGGTC ACCGCGCAAT TTGTGGAGAA CGCCTGCATT 
ATCGCCGGCC GCGACATCAA TATCCGTGAA GTGGCTATGA AGAGCGAACT CACCGCCGGA 
AACGAAGTAA TAGTCGGAGA GCAAGGAATG AAAAAGGGGC ACATCATCGG CGGCGTCTGT 
CGAGCCACCA CCCTTGTCCA TGCCATCATT GCCGGCTCCC CCGCCAACGT CAGCACGAGA 
ATTGAAGTCG GTGTCGATCC GTCCATCAGC GAAAAGCTCT CCATTGTCAA GCAGCAACTG 
GAGGAAAAGG AAAAACGACA GGAAGAAACC GCCAAGACAT TGGCATACAT CCGCGACAAC 
CCGGCCAAGG TTGATGCAGG AATGGCCAGA CTGAAGGAAC GGGTCTACAA CATCCAGCAA 
GCAGAAATCA CAGAACTGAC CGGACAAAAA AAACGCCTGC AAAAACGGCT TGAACTGGTC 
AACAACGCCA GAATAGAAAT AGAACGAACC GTATACTTCG GTGTCCATCT CATGGTTGGG 
GACAAGACCC TCCTGATCGA AGATGACCTG GAAAGCAAAA CTTTCACTCG CGGAGAAGAA 
GGAATCGCAT ACTGA

Protein sequence

MAEEAKQEKG LTFQISPDGG KLLATYEPVA QKVPIDTDWV WQALDAQNLS DLFILDDALS 
NLVKRCAVAA DRFTMQIGER RDGTLALTVA PDLMSAYITI TSAYGGNAVT SEQILQALQE 
QKIVSGILHD EIEKAVGERE VLKREIAKGR SPQPGEDSQF ISLIPEMRER CPLADDTDNV 
DYRNLGGIVS VKSGDPLMRR YPATKGTPGE NILGTPLPTT DGNDIAFTPN LSGTVFAEND 
SDLLLAAISG LPVQVDHGII VEPVINLKNV DLSSGNLHFE GTVNIAGDVK AGMEVKATGD 
IIIGGVAEAA KIEAGGNIEI KGGVIGQREV RNQKGELNPD ISYVHAGGSV TAQFVENACI 
IAGRDINIRE VAMKSELTAG NEVIVGEQGM KKGHIIGGVC RATTLVHAII AGSPANVSTR 
IEVGVDPSIS EKLSIVKQQL EEKEKRQEET AKTLAYIRDN PAKVDAGMAR LKERVYNIQQ 
AEITELTGQK KRLQKRLELV NNARIEIERT VYFGVHLMVG DKTLLIEDDL ESKTFTRGEE 
GIAY