Gene Gbem_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbem_2041
Symbol
ID	6782035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter bemidjiensis Bem
Kingdom	Bacteria
Replicon accession	NC_011146
Strand	+
Start bp	2348170
End bp	2349180
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	62%
IMG OID	642768036
Product	transglutaminase domain protein
Protein accession	YP_002138850
Protein GI	197118423
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGT TGTTGCTGTC GATGCTTGCA CTCTCACTCT GCGTTACTCC GGCTGCCTGG 
GCTAAAAGCC GCAGCGGTGT CGTCACGGTG GAAGTGGATC TTTCCAAACA AGAGCAGGGC 
AAGGAGACGA AACTCTGGAT TCCGTACGCG GTTTCCGGGA AACACCAGGC AGTCACGGAC 
GTCAAGGTGA GCGGCGATTT CGCCACCTCG GCGGTCTACA CCGACAAGGC CAACGGCACC 
CCCATCCTCT TCGCCCAGTG GGGCAAGGAT GCGGCCAGCC GCAAGCTCAC CTACTCCTTC 
TCCGTGGAAC GCGAGGAGTT ATTGGTGCGA GACCTTTCCG CCAAGGAGAC ATCCTGGAGC 
AAGGAGGAGT TCGCCCCCTA CCTGCAGTCG ACCTCCATGG GCCCGGTCGA CGGCGAGGTG 
AAAAAGCTCT CCGATTCCAT CACCAAGGGT AAGCACACGG TGCTGGAGAA GGCGAAGGCG 
ATCTATGACT GGACCTGCGA GAACATGTAC CGCGATCCGG CCACCGTCGG CTGCGGCAAG 
GGGAATGTCT GCGAACTGCT GAAAAAGCCC GGCGGCAAGT GCACCGACAT CTCGTCGGTC 
TACGTCGCCC TGGCGCGCGC TGCCGGCGTT CCCTCCCGCG AGGTCTTCGG GGTGAGGCTG 
GGCAAAAAAG CGACGGAGGA CATCACCTCC TGGCAGCACT GCTGGGTCGA ATTCTACCTC 
CCCGGCACCG GCTGGGTCCC GGTCGACCCG GCCGACGTGA GAAAGGCGAT GCTGGTCGAG 
AAGCTCGATC CGAAGGATGC GAAGACCCGC GAGTATCGGG ACTACTTCTG GGGCGGGATC 
GACCCGTACC GCTTCCAGGT CGCTACCGGC CGCGATATCG TCCTGAACCC GCCGCAGGCA 
GGCGCTCCGC TCAACACCTT CGGCTACCCT TATGCAGAGG TAGGCGGTAC TGCGCTTGAC 
TTCTACGATC CCAAGAGCTT CAGCTACCGG ATCACCTATA AGGAGCAGTA G

Protein sequence

MKRLLLSMLA LSLCVTPAAW AKSRSGVVTV EVDLSKQEQG KETKLWIPYA VSGKHQAVTD 
VKVSGDFATS AVYTDKANGT PILFAQWGKD AASRKLTYSF SVEREELLVR DLSAKETSWS 
KEEFAPYLQS TSMGPVDGEV KKLSDSITKG KHTVLEKAKA IYDWTCENMY RDPATVGCGK 
GNVCELLKKP GGKCTDISSV YVALARAAGV PSREVFGVRL GKKATEDITS WQHCWVEFYL 
PGTGWVPVDP ADVRKAMLVE KLDPKDAKTR EYRDYFWGGI DPYRFQVATG RDIVLNPPQA 
GAPLNTFGYP YAEVGGTALD FYDPKSFSYR ITYKEQ