Gene GM21_3672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3672
Symbol
ID	8139046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4246150
End bp	4247667
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	61%
IMG OID	644871293
Product	hypothetical protein
Protein accession	YP_003023451
Protein GI	253702262
COG category
COG ID
TIGRFAM ID	[TIGR01630] phage uncharacterized protein (putative large terminase), C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	169
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTAAGC GCCCAAACCT CACAGAAGGC CAGTTCGACC AGCAGGTCGA CGAGCTCAAG 
AAGTGGATCC GCGAGAGCGT CTCCCCCTTC GAGAACGACA CGCCGGCCAA GAAGAAGGCG 
CGCATCGAGC GCGGCAAGAC GGATCTGCTG TTCTTCTTCC AGACCTATCT GCCGCACTAC 
TTCATCTGCG CCTTTGGACC GGAGCTGCAT CCGGAGTGGG AAGAGGCGAC CCAACTGCAG 
GACCAGCTCG CCCTGATCGG CGCGTTCCGC GAGGGCGCCA AGTCGACCTT CTTCACCCTG 
GGCAATCCGG TGCACAAGAT CTGCTACGGG CTCAAGCGCT TTATCTGGCC CTGCTCCGAT 
ACCCATGAGC AGGCAGAGTC TTTCAGCACC CAGATCAAGC TGGAGCTGGA GGAGAATCCG 
CGTATCCGTC ACGACTTCGG CAACCTGAAG ACGAAGACCT GGAGCAACGA CGAGTTCGAG 
ACCAGCAACG GCGTCAAGGT GCTCGCCCGC GGCCGTGGAG ACAAGGTTAG GGGCATCAGG 
TACCGGCAGT ACCGCCCGGA CATGGTCGTA TTCGACGACA TGGAGAACGA CGAGACGGTA 
GAGAATCCGC GCACCACCAA GAAGATCTTG AACTGGATTC GCGGCGCCGT GCTCGGCTCC 
TTGGGCAAAG GCTACTCGGC CATCATGGTC GGCAACCTGT TCCACCCGCT CTCGGCCATC 
TGCCAGTTGA TCGCCGACGT GGATGACGAG GGGGAGAAGC GCTACTTCTC CAAGGTCTAC 
GCTTTGATCC TGGACGAGGG GGGGCCGAAC GAGAGATCGG CATGGCCTGC CAACTGGCCC 
ATGGAGCGCA TCACCAGGAA GCGCCGCGAC GTAGGCTCCT ACACCTTCAA CAAGGAGTAC 
ATGAACAAGG TAGGGACCGA CGACACGCCG TTCCCCGAGG AGCAGGTGAA GTGGTACCAG 
AAGATCGAGG TGGTCAACAG AAAGCTCATC TTCTGCACCG CCATCGACCC CTCGGCGACC 
GCCACCAGCG GCAGCGACTA TCGCGCCGTG GTCACCTACG GCTTCGACCC GCAGGCCATG 
CTTTTCCCCT GCATGCACGC CTGGATCAAG AAGCGCTCCA TCAACGAGAT GTTGGCCGCG 
GCCTACCAGC AAAACGACCA GTACCCGGGT GTGGTGGCCA TCGAAGACAA CATGCTGAAA 
GACTTCCTGC ACCAGGCGAT TCACAACTAC GCCAAGGAAG TCGGCCGCTA CCTCCCCTGG 
GCGCCGATGC AGCACTCGAC CAACAAGATC GGCCGCATCG TAGGTACCTG CAGCTACCTC 
TGGGAGCACG GCAAGATGCA ATTCGAGAAG GGGCATAGCG ACCAGGCGAA GCTCATCGAG 
CAGTTCGTCT ACATCTACAA CGCCACCGTC AACGACGACG GGCCCGACGC GGCGGAGATG 
GCCATCAGCA AACTCCAGGC GGGTCTGGGG ATTAAAACCA CCGACGCCCT TCCGGCGTTC 
GCAGGAGCAG CAGCATGA

Protein sequence

MRKRPNLTEG QFDQQVDELK KWIRESVSPF ENDTPAKKKA RIERGKTDLL FFFQTYLPHY 
FICAFGPELH PEWEEATQLQ DQLALIGAFR EGAKSTFFTL GNPVHKICYG LKRFIWPCSD 
THEQAESFST QIKLELEENP RIRHDFGNLK TKTWSNDEFE TSNGVKVLAR GRGDKVRGIR 
YRQYRPDMVV FDDMENDETV ENPRTTKKIL NWIRGAVLGS LGKGYSAIMV GNLFHPLSAI 
CQLIADVDDE GEKRYFSKVY ALILDEGGPN ERSAWPANWP MERITRKRRD VGSYTFNKEY 
MNKVGTDDTP FPEEQVKWYQ KIEVVNRKLI FCTAIDPSAT ATSGSDYRAV VTYGFDPQAM 
LFPCMHAWIK KRSINEMLAA AYQQNDQYPG VVAIEDNMLK DFLHQAIHNY AKEVGRYLPW 
APMQHSTNKI GRIVGTCSYL WEHGKMQFEK GHSDQAKLIE QFVYIYNATV NDDGPDAAEM 
AISKLQAGLG IKTTDALPAF AGAAA