Gene GM21_2204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2204
Symbol
ID	8137540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2575293
End bp	2576285
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	60%
IMG OID	644869819
Product	protein of unknown function DUF6 transmembrane
Protein accession	YP_003022014
Protein GI	253700825
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0000000000373443
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCGCCGG TCTTCTGCAA GATGCTCATC GGGGACATGT CGCCGGCTCT GCTGGCGGGG 
CTCCTCTATC TCGGCTCGGG CCTCGGCTTG CAACTCGTCC TCTTCTTCCA GCGCAAAAAC 
TCCCTCCACG AACTGGCTCA TCTCTCGCCG CGCCACCGGC TCAAGCTGAT CGGCGCCATC 
ATCTCTGGCG GCATCATAGC GCCTCTATGC CTCGCTTTCG GCATCAAGTA CGGCACGGCT 
TCGGAGGTCT CGCTGCTGCT CAACCTGGAA ACGGTGGCGA CGACCATAAT CGCCTGGCTC 
GTTTTCAAGG AGTACATCGG CCCCTATGTC TGGACCGGTA AGGTACTCAT ACTCATAGGC 
GCCGGCCTGG TGGTGCTGAA AGCTGAGGGG GGTATGTCCT TCTCCACCTC CGGGCTCCTC 
GTTATCTGCG CCTGCATCTT CTGGGGCATC GACAACAATC TGACCCGGGA CGTGGAGGAG 
CTTTCATCCA CGGTGCTCGC CTCGGTGAAA GGTTTCGCCG CCGGTCTCTT CTCCATCTTT 
TTGGCGCTCG CTTTTACCTC TGGATTGGCA ACTCCCTCGC AAATCTCCGG GGCCTTGGCT 
ATCGGCGCTC TTAGTTACGG ATTGAGTCTG GTCCTCTTTG TCGAGGCCCT GCGGAAGATC 
GGTGCGGCGA GAACCGCCAC TTTCTTCGCC GTAGGTCCTT TCTTCGGCAC GCTCCTCTCC 
GTGGCGCTTC TGGGTGAGCG CCCCCCTGCT GCCTACTGGA TCGCCACGGT GCTGATGCTC 
GCGGGGATCG CCCTTTTGTA CCTGGAACTG CACCGGCACA GCCACGCGCA TGAGGAAATG 
GCTCATGCCC ACCCTCACAT CCACGACGAG CACCACAATC ACGAGCATCC GGAAGGGGAG 
GTTGATCTCT CTCACGACCA TTACCATGTC CATCGTCCCA TGAGCCACTC GCACGTCCAC 
TGGCCGGACA TTCACCACCA GCATCCTCAC TGA

Protein sequence

MSPVFCKMLI GDMSPALLAG LLYLGSGLGL QLVLFFQRKN SLHELAHLSP RHRLKLIGAI 
ISGGIIAPLC LAFGIKYGTA SEVSLLLNLE TVATTIIAWL VFKEYIGPYV WTGKVLILIG 
AGLVVLKAEG GMSFSTSGLL VICACIFWGI DNNLTRDVEE LSSTVLASVK GFAAGLFSIF 
LALAFTSGLA TPSQISGALA IGALSYGLSL VLFVEALRKI GAARTATFFA VGPFFGTLLS 
VALLGERPPA AYWIATVLML AGIALLYLEL HRHSHAHEEM AHAHPHIHDE HHNHEHPEGE 
VDLSHDHYHV HRPMSHSHVH WPDIHHQHPH