Gene GM21_0067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0067
Symbol
ID	8135366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	84881
End bp	85951
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	644867684
Product	twitching motility protein
Protein accession	YP_003019912
Protein GI	253698723
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2805] Tfp pilus assembly protein, pilus retraction ATPase PilT
TIGRFAM ID	[TIGR01420] pilus retraction protein PilT

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	2.78052e-25
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAAGGA TAGACGCACT GTTCAAGCTG TTGCACGAAG CCGGGGCCTC CGACCTGCAC 
CTTTCCGCCG GGTCCCAGCC GATCTTCCGG CTGCGCGGCG AGATGGAGCG GCAGAACTTC 
AAGTCGCTTG GGCACGAGGA ACTGAAGGCG CTCCTTTACG AGATCCTGAC CCCGAAGCAG 
CGCGAGACCT TCGAGGAGAA GCACGACCTC GACTTCGCCT ACTCGGTCCC GGGCCTGGCG 
CGCTTCCGCG GCAACTACAT GATGCAGCAC CGGGGGATCG CGGCGGTGTT CCGCATCATC 
CCGAGCAAGA TACTTTCCGC CGACGAGCTG GGGCTTCCGG AAGGGATCCG CAACCTGACC 
AAGCTGAGGA AGGGGCTGGT GCTGGTCACA GGTCCCACGG GGAGCGGCAA GTCGACGACG 
CTCGCCGCGA TGATCGACCT GATCAACTCT ACCCGTAGGG AGCACATCCT GACGCTCGAA 
GACCCGCTGG AGTTCATCCA CGAAAACAAG ATGTCCCTCT TCAACCAGCG CCAGATCGGC 
GAGCATTCCG ACAGCTTCGC CAGCGCGTTG AGGGCGGCCC TCAGGGAGGA CCCGGACGTG 
ATCCTGGTGG GCGAGATGCG CGACCTTGAG ACCATCGCCC TCGCCATGAG CGCCGCGGAG 
ACCGGGCACT TGGTGTTCGG CACCCTGCAC ACCAGTTCCG CCGCGAAGAC GGTGGACAGG 
ATCATCGACG TCTTCCCCAA GGACGGCCAG GAGCAGGTGC GCGCCATCCT TTCGGAATCG 
CTCCGGGGGG TGGTCTGCCA GCAGCTCCTG AAGACGGCCG ACGGCAAGGG GAGGGCGGCC 
GCGCAGGAGA TCATGGTCTG GAACAACGCC ATCGGGAACC TGATCCGCGA AGGGAAGACC 
TTCCAGATCC CCTCCATCAT GCAGACCGGC AAAAAGGACG GGATGCAGCT CATGGACCAG 
CACATCCTCG ACCTCTTGAA GACCAGGAAA ATCACACCGG AGGAGGCGTA CCGCTGCTGT 
CAGGACAAGA GGCAGTTCGA GCAGTACCTC CCGGCGCAGG CGGAGCATTA G

Protein sequence

MARIDALFKL LHEAGASDLH LSAGSQPIFR LRGEMERQNF KSLGHEELKA LLYEILTPKQ 
RETFEEKHDL DFAYSVPGLA RFRGNYMMQH RGIAAVFRII PSKILSADEL GLPEGIRNLT 
KLRKGLVLVT GPTGSGKSTT LAAMIDLINS TRREHILTLE DPLEFIHENK MSLFNQRQIG 
EHSDSFASAL RAALREDPDV ILVGEMRDLE TIALAMSAAE TGHLVFGTLH TSSAAKTVDR 
IIDVFPKDGQ EQVRAILSES LRGVVCQQLL KTADGKGRAA AQEIMVWNNA IGNLIREGKT 
FQIPSIMQTG KKDGMQLMDQ HILDLLKTRK ITPEEAYRCC QDKRQFEQYL PAQAEH