Gene GM21_4063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4063
Symbol
ID	8139437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4646890
End bp	4648215
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	52%
IMG OID	644871679
Product	integrase family protein
Protein accession	YP_003023837
Protein GI	253702648
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	127
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCCT TCCTTAAGAT AAAAACCGTG ATCTTGGCGA ACGGAGGTCG GCGGCCGATG 
TTGATTGACC GGACAGACGG CATGCCGTTA GTTAACCCCA CCTTCTACAT CACCTCTATG 
GTCTACCTCC CGGGACTTGA ATTGAACACC CAAAAACAGG TCCTCTCCGC GATCCAGTTC 
CTCTACGAGT GGAGCAAGAG GAACAGAATC GACCTTGAAG AACGGTTCGG GTTGGGCCAC 
TTCCTCGAGC TCCGAGAAAT AGAAAAGGTA TGCGTGGATA TTAGAATGGA TTTCCGCAAT 
TACTGCTTTG ACCCTCTTGC GTTTGCTGGA GCCAGTCGGC CAATGCAGAG GACGAAAACG 
ATTGTCCGGC TTCACAGGCC GCGCAAACCA AGATACCTTA ACAACATGTA TAACTGCGGC 
GCGACCACAT CCATCAAGCT CTCGTATATC AAGAATTACC TCGACTGGTT GGCTGCCGAG 
ACAATTGGGA GATCTTCCGC GAGGGAACCG GAATTTTCCT CAATGCAGAC CTCCCGCGCT 
GAGATGGTCA AGTGGCTCAC GGAGCGAATC CCTTCGGCAG GGGAGTCGCC ACTAAAAAGA 
GGACTTACGC CTGAGGCGCG GACGCGACTT CTCGACGTGA TCGACCCGAA GCATCCAGAC 
AATCCGTTTA AAAGCGCATT CGTCCGTGAA CGCAACCGCC TGATCATTTT GTATCTCGAC 
CGCCTCGGGA TACGGAGGGC TGAAGCGCTT CTGATAAAGT TGGGGAAATT TCTTAACGTA 
TTTCCCTCTG CGGGATGCCA GGAGGGCTCC GTGGAGATTC GCGAGCACGT AAATGATCCT 
GAGGATACAA GACGTAACAG GCCACAGCTG AAAACTGCTG AGCGTCCCCT ACCGATCGGC 
ATGGAACTTT GCAGTTTGAC TCGGGACTTC ATAAACCTTT ACCGCAGCAA GATTCCGCGC 
GCGCGCTGCC ACGGCTACTT ATTTGTATCA AGGAGCGGAG AGCCGCTGAC GCTGAGCAGT 
CTAGACGATA TTTTTGCAAA GGTTAGAACT GTTGAAGGTA TACCTGACCT TATTTCCGCG 
CACCTACTTC GTTACACTTG GAATGACAGG TTCTCCGAAT TTGCTGACCA GATGATCAAG 
TCTGGTGAAT GGAAAAGCAA GGACGAAGAG GAAATTCGGC GTTTGCAGCA GGGTTGGAGT 
CCAGATTCCA AAATGCCGGG CAAGTACAGT CGGCGGTTTC TTGAGAATAA GACACGGCAG 
GTCAGCATTC ATCTGCAGGA AAACCTGTAC ACCGTCAAAA TTCCTGACCT AACACCGGAG 
AAATAA

Protein sequence

MSSFLKIKTV ILANGGRRPM LIDRTDGMPL VNPTFYITSM VYLPGLELNT QKQVLSAIQF 
LYEWSKRNRI DLEERFGLGH FLELREIEKV CVDIRMDFRN YCFDPLAFAG ASRPMQRTKT 
IVRLHRPRKP RYLNNMYNCG ATTSIKLSYI KNYLDWLAAE TIGRSSAREP EFSSMQTSRA 
EMVKWLTERI PSAGESPLKR GLTPEARTRL LDVIDPKHPD NPFKSAFVRE RNRLIILYLD 
RLGIRRAEAL LIKLGKFLNV FPSAGCQEGS VEIREHVNDP EDTRRNRPQL KTAERPLPIG 
MELCSLTRDF INLYRSKIPR ARCHGYLFVS RSGEPLTLSS LDDIFAKVRT VEGIPDLISA 
HLLRYTWNDR FSEFADQMIK SGEWKSKDEE EIRRLQQGWS PDSKMPGKYS RRFLENKTRQ 
VSIHLQENLY TVKIPDLTPE K