Gene GM21_0276 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0276
Symbol
ID	8135583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	335165
End bp	337039
Gene Length	1875 bp
Protein Length	624 aa
Translation table	11
GC content	63%
IMG OID	644867896
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003020118
Protein GI	253698929
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTATC CAAAAAACGG CAGGATCTAC CGACCCGCGC TGCTACTCCT GGGCCTTTTA 
TCCTGCGGCT TTACCTGGGG CGCTCCGAGC ATGCCCCCCT GCGACAAGGC AAGGGAGGCG 
GTCCGGGAGA TCACGCGGCA GAGTTCGGCC GACCAAAGGC TTGAGGCGGA GAAAAAGGTC 
GAAAAACTCT GCGCCGACGG CGGCGCCGCA CATTATCTTA AGGGGCTCGC CCTGGAGACG 
GCTCAACGAC AGGAAGAGGC GGTCGATGAG TACCGGACCG CCGTGAAAAA AGAACCCAAG 
CTTGCCGAGG CGCACGGCAG GCTCGGGTTA CTCCTTTTTG AAAAGGGGGC GCGTGAAGAG 
GCATCGGTTG AACTGTTCGA AGCGTCGAAG GCGAACGCGG ATCCAGCCTA CGCGAGGGCC 
TTGGGAGACA TCTTCCAGGC AGCGCAGCTT TACGCCCTGG CCCTGTCGCA GTATCAACAG 
GCGCTGCCGC AGTACGGAAA AGACGCGAAG CTGCGTGTCG GCATGGCGCG CAGTTATCTC 
GGGTTCGGCG AGCGCGCGAA GGCACGGGAT CTGCTCATCG AGGCGCTAAG GCTCGATCCG 
GCGAACCTTC CGGCGCGCCT GGAGCTTGCC GGGATTTACA AGGGGGACAA GCGGTACCAA 
GAGGCGTTGG AACAGCTGCG GCAGGCAAGC GCCTCCCATC CCGAGGACCG GGACGTCCAC 
TTCCGCCTGG CCCGCCTTCT GGACCTGATG GGAGAGGAGA AGCTCGCCGA TGCGCAATAC 
CGGCAGGCCG GGATGGAGCG GGCGGCAAGT CCCGAAGAGC ACCTGAAAAA GGCGGCGCTG 
TACCGGCAAG GAACCGCCTT TTCGAAGGCG GCGCGGGAGT ACGAGGCCCT GCTTTTGAAG 
CAGCCGGACG CGCCGGGGGT CCGCGAGAAA CTGGGGGATG CACTCCTTGC AGCGGGGCAT 
GACGGCGAGG CGATAGCCGC CTACGAGGAA GCGTTGCGGC GCAAGGAAGG ATCGAGCGCG 
GTTCTCTACA ACCTGGGCAC CCTCTATGAG CGCAAGGGAG ATCTCGACCA GGCGATGCGC 
CGCTTTTCCG AGGCGATACG GCTCGACCCG GAATACGGCG ACGCCCGCAG GAGGCTCGCC 
GAAATCCACT CGGTGCGCGG CGATCTGAAC GCCGCCATCG CGCAGTACCG GGAGCTCGTC 
TCGCGCCACG GGGACAACCC GCTTAGCTAC TACAAGCTGG CCCGGCTCTA CGAGCAAGGC 
CGCCAGTACG CCGACGCCAT CGCCGCCTAC TCCAAGGCCA TCGAGCTCGA CCAGGACAGC 
GAGGTCGCCC ACCAGGGGAT CGCGCGGCTC TACCTGAAGC GCAAACAGGC GGAGGAGGCG 
GAAAAGCACC TCCTCGAAGT GCTGAGGCTC GACCCGAAGC ACGCCGAGGC GAGGGAGCTC 
CTCATCTCGC TGTACGTCAA GGCGCGGCGC TACGACGACA CCGAGAAGCT TCTTAAGGCC 
TCGGCGGAGC TGAACCCGGA TAGCGCCAAC GACCAGTACC GGCTGGGGGT CATCTACGCC 
TTCCGCGGCA ACAACGACGG CGCGCGGGAG CAGTACCAGA AGGCGCTCGA GCTGAAGCCG 
GACCACGCCC GGGCGCTTAA TGCGCTGGGT AAGCTCTACC TGCGACTGGG CCAGAAGGAA 
AAGGCCCGCG AAGCACTGGC TGCGGCACGC AAAGCCGACC CGGACCTCCT GGAGCCGGTG 
GAGCTCCTGA GCAAGCTGGA CCTCAAAAAG GCGCAAAAGA AGCAGGAGTA CAGGAAACAT 
AAGAAAAAGA AGGCGAAGAA GGTTTCGAAG AAGCGCAAGG GGAAGTCTAA AAAGAAGAAG 
AAAGGCAGGA GATAG

Protein sequence

MNYPKNGRIY RPALLLLGLL SCGFTWGAPS MPPCDKAREA VREITRQSSA DQRLEAEKKV 
EKLCADGGAA HYLKGLALET AQRQEEAVDE YRTAVKKEPK LAEAHGRLGL LLFEKGAREE 
ASVELFEASK ANADPAYARA LGDIFQAAQL YALALSQYQQ ALPQYGKDAK LRVGMARSYL 
GFGERAKARD LLIEALRLDP ANLPARLELA GIYKGDKRYQ EALEQLRQAS ASHPEDRDVH 
FRLARLLDLM GEEKLADAQY RQAGMERAAS PEEHLKKAAL YRQGTAFSKA AREYEALLLK 
QPDAPGVREK LGDALLAAGH DGEAIAAYEE ALRRKEGSSA VLYNLGTLYE RKGDLDQAMR 
RFSEAIRLDP EYGDARRRLA EIHSVRGDLN AAIAQYRELV SRHGDNPLSY YKLARLYEQG 
RQYADAIAAY SKAIELDQDS EVAHQGIARL YLKRKQAEEA EKHLLEVLRL DPKHAEAREL 
LISLYVKARR YDDTEKLLKA SAELNPDSAN DQYRLGVIYA FRGNNDGARE QYQKALELKP 
DHARALNALG KLYLRLGQKE KAREALAAAR KADPDLLEPV ELLSKLDLKK AQKKQEYRKH 
KKKKAKKVSK KRKGKSKKKK KGRR