Gene GM21_3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3005
Symbol
ID	8138348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3491964
End bp	3493169
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	62%
IMG OID	644870603
Product	type II secretion system protein
Protein accession	YP_003022792
Protein GI	253701603
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.00232151
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCCTCT TTACCTGTAA AATAGGCGCC TCCGACGGCA AGGTCCTGGT CAAGGACCTC 
GACGCGGTCA ACGCCGGCTT GCTTCGGCAG AGCCTGGAAG AGCAGGGTTA CGTCGTCTTC 
GGGGTGCGCA AGAAGCCGTT TCAGTTCCTG CTGGAATCGG GTATCGGGCG CAAGAAGATC 
GGCAACAAGG AGCTCTTGTT ATTCAACCAG GAACTCCTGG TGCTTCTCAA GGCCGGTCTC 
CCCATCCTGC AGGCGCTCGA CACCATCCTG GAGTCGGGAG GGGGCAAGCT CAACGAGATA 
CTTTCGGCGA TCCGCGAGGA CGTGAAAGGG GGACTGGCGC TCTCCGCCGC CTTCGAGAAG 
TTTCCGAGGG TGTTTCCCCA TCTCTACATC GCGTCGGTCC GGGCCGGCGA GAGGACCGGG 
GACCTGCCCC AGACCATCCG CCGTTACATC GCCTTCCTCA AGAGAACCGA GGGTTTCCGC 
GGCAAGATCA TCGGCGCGCT CATCTATCCC GTCATCCTGA TCGCGGTCGC GGCGGTGGCG 
ATCTCTCTTT TGCTCATCTA CGTGGTGCCG ACCTTCAGCA CCATCTACGC GGATTCCGGC 
GCCGCTTTGC CGATTCCGAC CCAGATACTG ATCAACTTCA CCGGGCTCTT GCGGCGCTAT 
CTGCCGCTGC TTCTGCTGCT GGCGGCCGTG GCGACGACGC TCTTCAAGCG CTGGAGCCAG 
ACCGAGTCCG GGCGCTATGC CGTTGACGGC TTCAAGATCA AGACCCCGCT TCTGGGCGCC 
ATCACCAGCC GATACGCCCT GGCCGGCTTT ACCCGCACCC TGGCCACGGT GCTCGGCTCC 
GGCATCCCGA TCGTCGAGGC GCTGCGGATG TCGGTGGGGA CGCTCAACAA CAAGGTGCTG 
GAGCGCGGTC TGCTCCTGGC GGTACACCGC GTCGAGGAGG GGAGCAAGCT TTCCACCGCG 
CTGGAAGGGA TGAAGCTGAT GCCCCCCCTG GCGCTGCGCA TGCTCACCGT AGGCGAGACC 
ACCGGCTCCC TGGAGGAGAT GCTTTCCGAC ATCTCCGATT ACTTCGAAGA GGAGATCGAA 
AGGGATCTCC ATGTACTGAC CACCTCCATC GAGCCGGCGA TCATGGTGGT CATGGGTGTG 
GTCATCGGGG TCATCATCGT CACCATGTAC CTGCCGATCT TCAAGATCGC CAGCACCGTC 
AGCTAG

Protein sequence

MPLFTCKIGA SDGKVLVKDL DAVNAGLLRQ SLEEQGYVVF GVRKKPFQFL LESGIGRKKI 
GNKELLLFNQ ELLVLLKAGL PILQALDTIL ESGGGKLNEI LSAIREDVKG GLALSAAFEK 
FPRVFPHLYI ASVRAGERTG DLPQTIRRYI AFLKRTEGFR GKIIGALIYP VILIAVAAVA 
ISLLLIYVVP TFSTIYADSG AALPIPTQIL INFTGLLRRY LPLLLLLAAV ATTLFKRWSQ 
TESGRYAVDG FKIKTPLLGA ITSRYALAGF TRTLATVLGS GIPIVEALRM SVGTLNNKVL 
ERGLLLAVHR VEEGSKLSTA LEGMKLMPPL ALRMLTVGET TGSLEEMLSD ISDYFEEEIE 
RDLHVLTTSI EPAIMVVMGV VIGVIIVTMY LPIFKIASTV S