Gene GM21_0366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0366
Symbol
ID	8135673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	443943
End bp	445262
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	61%
IMG OID	644867983
Product	integrase family protein
Protein accession	YP_003020205
Protein GI	253699016
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.134449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGCG GAATCCGATT TACCGACCTG TACATTAAAA ACCTGAAGCC CATGGAAAAG 
GATTACTGGG CGCGCGAAGG GTTGGGGTTT GCGGTCAGGG TGGTTCCTTC CGGGGAGAAG 
CTTTGGTACT ACATTTACAC CTTCCAGGGA AAGAAGCGGT ACATGTGGCT CGGGAGCTAT 
CCTGCGGTGC CGCTGGCGGC TGCCCGGGAG GCCTGTGAAG TAGCCAGGGC CAAGGTGAAA 
GCCGGCACAG ACCCATTAGC GCAGAAGGAC GCGGAGCTGG AGGAGCGGCG CAAGGCTCCC 
ACGGTTGCCG ATCTGTGCGC CGAGTACCTG GAGCGCCACG CCAAGCAGTT CAAGCGCTCC 
TGGCAGAAAG ATGAGCAGAT GATAAAGCGG GACGTACTGC CGGAGTGGGG CAAGCGGAAG 
GCTCGGGACA TCACCAAAAG GGACGTGGTG CTGCTCTTGG AAAAGATCAT GGATCGCGGT 
GCGCCGATAC AGGCCAACAC CACCTTCGCC CTAATCCGCA AGATGTTCAA CTTCGCGGTG 
GAGCGGGACG TCCTGGAACA CACCCCCTGC CATGGCGTCA AGCCTCCGGC GCCGAAGGTG 
GCCCGGGACC GGGTCCTCTC GGAAAGTGAG ACCAGGTCCT TCTGGCACAA CCTGGACGCC 
TGCTGCATGT CCAATGAAAC CAGGCGCGCC TTGAAGCTGG TGCTGGTCAC CGCGCAGCGG 
CCGGGCGAAG TGATCGGCAT GCATACCGAC GAGATAAAGG GGGAGTGGTG GATACTGCCT 
GGAGATAGGG TGAAAAACAA GAAATCCCAC CGGGTGTACC TGTCGACGCT CGCCAGAGAG 
ATCCTGGCGG AGGCTGTCGC TGAGAACAAG GAAAAGCTCG GCATCCCGGG GGACCAGGAG 
TATCGCGGCT TCATGTTTCC TTCCCCCCAA CTTGCCAAAG TGCAGCCCAT AGCTCCGCAG 
GCGCTGATCG TGGCGGTGGG GCGGGCCCTT GCTTCCCCGG TGCTCGATCC GAACTTCAAA 
CGGGTCCTCG ACCGGGAGGG GAAGCCCGTC ACGGTAAACC GGCTCGAGGT CGCCCACTTC 
ACCCCGCACG ATCTGAGGCG CACCGCGGCA ACGTTCATGG CAGAATCCGG CGAGATGGAT 
GAGGTGATCG ACGCCGTTTT GAACCACGCC AAGCAGGGGG TGATCAGGGT CTACAACCAG 
TTCAAGTACG ACGCGCAGAA GCAAGCGGCG CTCGAATCTT GGTCCAGGAG GCTCATCTGC 
ATCACCACAG GCGTGAAGGG AAAGGTGATC GCCATCGGCA GCCGGTCCAA CTCGGCGTAA

Protein sequence

MKSGIRFTDL YIKNLKPMEK DYWAREGLGF AVRVVPSGEK LWYYIYTFQG KKRYMWLGSY 
PAVPLAAARE ACEVARAKVK AGTDPLAQKD AELEERRKAP TVADLCAEYL ERHAKQFKRS 
WQKDEQMIKR DVLPEWGKRK ARDITKRDVV LLLEKIMDRG APIQANTTFA LIRKMFNFAV 
ERDVLEHTPC HGVKPPAPKV ARDRVLSESE TRSFWHNLDA CCMSNETRRA LKLVLVTAQR 
PGEVIGMHTD EIKGEWWILP GDRVKNKKSH RVYLSTLARE ILAEAVAENK EKLGIPGDQE 
YRGFMFPSPQ LAKVQPIAPQ ALIVAVGRAL ASPVLDPNFK RVLDREGKPV TVNRLEVAHF 
TPHDLRRTAA TFMAESGEMD EVIDAVLNHA KQGVIRVYNQ FKYDAQKQAA LESWSRRLIC 
ITTGVKGKVI AIGSRSNSA