Gene GM21_1447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1447
Symbol
ID	8136776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1704183
End bp	1705475
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	46%
IMG OID	644869060
Product	integrase family protein
Protein accession	YP_003021262
Protein GI	253700073
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	103
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCATATC CAACCCATCT GATACGTCGT AATGGTCATT ACCACTACAA GATCAAAGTC 
CCCGTAGATC TCCAGCAGCA CTTCCCCTGC ACCTTCATAA ACCGATCTCT TAAGACCACC 
GATCTCCAGG AAGCCAAGAC CATCTTGGTA GGGATGGAGT ATAGAATTCA TAGGGTCTTC 
ACCCTGTTGC GTACCGGTAT GCTATCTGAA GACATGACCA AGCAGGTTGT CAGTGATATC 
GTGCCAGTAA GGGCAAAGTC GGTGGTAGCA AAAGGCTTAA TGTTGTCTGC TGTCATCAAG 
CAATATGTCT TTGAAAAAGA GGCTCAATGG ACGCCTAAGA CCAAGATGGA AATGGCAGGG 
GTCTTTAAGG TGGTTTTGGA TGTTCTTGGG GATGTCGATG TGAAGAGCCT CAACAGGCAA 
GCTTTGCTAG ACATGAGGTC AACTCTGATG AAGCTCCCTT CCAATATGTA TAAGAGGTAT 
CCTGGTCTGA CAGTGGGGCA GTTGTTGGAG ATGAGTGATA TCACGCCAAT GAGCATCAAG 
TCGGTAAACA AGTATATGAA AGGAGTAGGG GCTGTATTAC GCTACTGTGC TAAAGAATGC 
CTGATCGTGG TCAACTACGC CGATGGCCTC AAGATAATGG AAAAAAGCAA GCCTGACCAG 
GAGCGGAGCA TATATGACAA TGCCGATATG AAGAGGATAT TCGATAACTT GCCACGCAAG 
GAGAAATATC CTGAAAGGTA CTGGATACCC TTGATAGGCT GTTACTCGGG GATGCGCCTC 
AATGAAATCT GTCAATTATA CGTTGAGGAC ATTCAACAGG TAGAAGGTAT ATGGTGCTTT 
AATATAAATG GAGACAAAGA TAAGAGACTG AAGAACCAAA CAAGTGAGCG GATCATACCG 
ATACATCCGA AGCTGATCGA GCTTGGGCTG ATAGAATACT GGCAGGTTGT CAAAGAGTCA 
GGTGTTCCGA GACTATGGAT GGAGCTTACT TGGATGGATG TGAACGGTTA CAGTAACAAT 
TTTGGTAAAT GGTATCAGCG GTTTAACAGG GAATGCGTGA CGTCCGATCC GAAAAAAGTG 
TTTCATTCGT TCAGGCATGT TGTGACAGAT ACGTTGAAGC AGGCCGGTGT GCAGGACTCG 
ATTATTGCTG AACTGGTAGG CCACAGTCAA GGCACCCACT CCATGACCAT GAGCCGGTAC 
GGGAAGAGGT ATCAGCCGAA GGTGCTCCTG GAAGCAATGG TGCACCTAGA TTACGGCATC 
GAAATATCCC CTATGCAAGT ACCTGGATTA TAA

Protein sequence

MSYPTHLIRR NGHYHYKIKV PVDLQQHFPC TFINRSLKTT DLQEAKTILV GMEYRIHRVF 
TLLRTGMLSE DMTKQVVSDI VPVRAKSVVA KGLMLSAVIK QYVFEKEAQW TPKTKMEMAG 
VFKVVLDVLG DVDVKSLNRQ ALLDMRSTLM KLPSNMYKRY PGLTVGQLLE MSDITPMSIK 
SVNKYMKGVG AVLRYCAKEC LIVVNYADGL KIMEKSKPDQ ERSIYDNADM KRIFDNLPRK 
EKYPERYWIP LIGCYSGMRL NEICQLYVED IQQVEGIWCF NINGDKDKRL KNQTSERIIP 
IHPKLIELGL IEYWQVVKES GVPRLWMELT WMDVNGYSNN FGKWYQRFNR ECVTSDPKKV 
FHSFRHVVTD TLKQAGVQDS IIAELVGHSQ GTHSMTMSRY GKRYQPKVLL EAMVHLDYGI 
EISPMQVPGL