Gene GM21_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2157
Symbol
ID	8137493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2520342
End bp	2521421
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	61%
IMG OID	644869772
Product	TPR repeat-containing protein
Protein accession	YP_003021967
Protein GI	253700778
COG category
COG ID
TIGRFAM ID	[TIGR00756] pentatricopeptide repeat domain (PPR motif)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	114
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGTTCG GACTTTTCAA GAAGAAGGAT CATCGTTACT ACCAGGCCCA GGGTGTTAAG 
TTTCTGGCTG CGGAGCGCTA TGCCGACGCC CGGGTCGACT TTCTCGAAGC GCTGAGGCTT 
TGCCCTGCTG ACGCCGTGAC CGACCAGGGC GAGATCCGCC AGGGGCTGGA TCGCTCGGGA 
AACCGGCTGG GCGAACTCAA CCTGGAGGAG GGGGAACATT GCCTAAACCT GGGGGAGCTG 
CAAAAAGCGT TCGACCACTT CACCCTCGCC GCCGAACTGG CAGCCGACCA GGGGATCAAG 
GCCAAGGCCC AATCGGGGCT CGGCAGGGTG CAGCAGGGGA ACGCACCACC GGCTTCCCCT 
GCCGCAGCCG CCGTTACTCC GGCTGCCGCC GCTCCCGCGA AGGAAGTTGC CGGGCCCTAC 
AAGCCGCACG GCGGAGGCTC CTGCACCTCC TGCGGCACCC ACGCACCGAA AAAGCCTCTG 
GAGGCGGAGC CCACCGGATT CGATCTCGCC GACGAGGACC AGTTTCACCT CATGGTGGCG 
CCGCTTCCCG GCGACCTCCC CGTCCGTTAC GGCGCCATGG GAAGCAAATT CGCCCAAGCC 
TATCTCATGA TACACGACGG AAAGGACGCT AATGCGCTCC CCGTTTTGCA AGAAATGCTG 
TTATCTGGTG AAAATGACAT TGTATTATAC GAAGTGGCAC TTATAATGTT CAGGGCCGGG 
CGCATTCATG AGAGCCAAGC GCTTCTGAAT CGCGCTCTTT CGGTCAACTC GGGAAACGGC 
ATGGCTTACC TCGCGCTGGT GCAACTTTTG GCCGGCGGCG GCAGGTACGC CGAGGCAATC 
GCCCTGGTTG AACGGATGCT GGCGGAAAAC GTGATGGCGG ACCAGGCGCA GTTCATCCTG 
GGCGAGCTCT ACGAGACGAC GGGGGACGAG GCGAAGGCGA TCGAGATGTG GTCGAAGGCG 
CTGGAGATAC CGACCGTGGC ACGCGCGGCC GCCGAGAAGC TGGTCCCGAT CCTGGGGAGC 
CAGGGGCGTA CCGAAGAGGT CAAATATCTA GCCAAAAAGT ACTTAAAAGG ATGCTGCTAA

Protein sequence

MLFGLFKKKD HRYYQAQGVK FLAAERYADA RVDFLEALRL CPADAVTDQG EIRQGLDRSG 
NRLGELNLEE GEHCLNLGEL QKAFDHFTLA AELAADQGIK AKAQSGLGRV QQGNAPPASP 
AAAAVTPAAA APAKEVAGPY KPHGGGSCTS CGTHAPKKPL EAEPTGFDLA DEDQFHLMVA 
PLPGDLPVRY GAMGSKFAQA YLMIHDGKDA NALPVLQEML LSGENDIVLY EVALIMFRAG 
RIHESQALLN RALSVNSGNG MAYLALVQLL AGGGRYAEAI ALVERMLAEN VMADQAQFIL 
GELYETTGDE AKAIEMWSKA LEIPTVARAA AEKLVPILGS QGRTEEVKYL AKKYLKGCC