Gene Gura_4178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4178
Symbol
ID	5165975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	4839530
End bp	4840987
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	54%
IMG OID	640551656
Product	transglutaminase domain-containing protein
Protein accession	YP_001232894
Protein GI	148266188
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00683366
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTTGT ACCGCCAACT GTCCCTTTTT ATCATCACCC TTTTTCTTGT TGTCTCCCCC 
CTCCTCTCTT TTGCCGCATC AATCCCGCGC CTGAGCGCCC CCCCTATTGG CGAACGCTGG 
TACAGCGTCA ACATGGGCGA TGAACGGGTC GGATTTTCCC ATCTGAAAAT CACTGAAACA 
GCCGATGGCT ACGAGATTTT CAGCGAAGGG AGCGTAAAAA TGCTGGTAAT GGGCTTTTCA 
CGCGAGGCTG TGGCGCGGGA AACCTATCTG GTAAACAAGG ATCTGTCGTT AAAATCTTTC 
AGCGTGGAAC AGACCATTGA CGGCAGCCCG ATGAAACTGA AGGGTGAAGT TACCGGCAAA 
GGGGTAAAGG TTGTCATAGA ATCGGCCGGG AATAAAAAGG AGAAGACCCT CAAGGCAAAG 
GGGAAACTCC TGCCGCCGCC CGCCGTGAAC CTGTATCCGT TCATGCAGGG CGCTATGCCC 
GGCAAACCAT GCCGTGTCCA GATGCTGGAT GTGGAAGGGG TAAAGGTCAA AGAGGTAAAG 
ATCCAGGTGA TCGGGGAGGA GATTCTCCCT GGCGGCGTGA AAGCCATTCA TTTCCAGAAT 
GATTTATATA CCTTTGTCGA TAACGATGTC TGGCTGGACG CGGCAGGGAA CACCATCAAA 
GAATCGGTGC GTGACGGCCT GGTTGTAACC CAGGCTGAAG ATGCGCAGAG TGCCGGGAGA 
TTCATTGCCG AGGCAGTCCT GGCCAAGAAG GACCTGATTT TAGACTTCAG CCTGATAAAG 
GTTGATACAC CGATTAAAAA TCCAGGGGAG CTGAAAAAAC TCGAGATCTC TTTCTCAGGT 
ATCCCCACCG CTATCCCGCT TCTGCAAGGA GCGGGACAAA AGGGGGACAG ACTGGCAGAC 
GGCAGCGTCA GGTTCACCCT GGAAATCGCC CCATATAAGG CAAAGACATC GCCTGCCGCC 
TATGACAAAA CGGCATTCGC CCCCTACCTG GAGTCAAGTG AGCGGATTCT CGCGGATAAT 
CCTGAAATAA TCAGCAAGGC AACGGAGATT GTCGGAGCAG AAAAAGACCA GTTGAAGATC 
GTGGAAAAAC TCACCAACTG GGTCGCCACA ACGGTGAAGG GAGCAGTAAC CGACAGCCAG 
TCACCACTGG AAACCCTGAA GAAGGGGAGC GGCAACTGCC AGTCACACGC ACGGCTCTAT 
ACCTCACTGG CAAGGGCCGC CGGCATTCCG ACCAGATTCG TCTCGGGGCT TGTCTATGCG 
CCTGGGCAGG GATTTCTCTA CCACAGCTGG GCAGAAAGCT ACCTGGGCGA ATGGGTGGCC 
GTGGACCCCA CCTTCGGCCA GTTGCCGGTT GATGCAGGCC ACATAAAGCT GGTTGAAGGT 
GACTCCCCCG AAGATATGTC CCTGCTGGCC GGTGTCGTCG GCAAGCTCAA GGCCAGAGTG 
ATCGAACAGA AATACTGA

Protein sequence

MSLYRQLSLF IITLFLVVSP LLSFAASIPR LSAPPIGERW YSVNMGDERV GFSHLKITET 
ADGYEIFSEG SVKMLVMGFS REAVARETYL VNKDLSLKSF SVEQTIDGSP MKLKGEVTGK 
GVKVVIESAG NKKEKTLKAK GKLLPPPAVN LYPFMQGAMP GKPCRVQMLD VEGVKVKEVK 
IQVIGEEILP GGVKAIHFQN DLYTFVDNDV WLDAAGNTIK ESVRDGLVVT QAEDAQSAGR 
FIAEAVLAKK DLILDFSLIK VDTPIKNPGE LKKLEISFSG IPTAIPLLQG AGQKGDRLAD 
GSVRFTLEIA PYKAKTSPAA YDKTAFAPYL ESSERILADN PEIISKATEI VGAEKDQLKI 
VEKLTNWVAT TVKGAVTDSQ SPLETLKKGS GNCQSHARLY TSLARAAGIP TRFVSGLVYA 
PGQGFLYHSW AESYLGEWVA VDPTFGQLPV DAGHIKLVEG DSPEDMSLLA GVVGKLKARV 
IEQKY