Gene Gmet_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_1503
Symbol
ID	3741634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	+
Start bp	1701614
End bp	1703194
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	54%
IMG OID	637778789
Product	hypothetical protein
Protein accession	YP_384462
Protein GI	78222715
COG category
COG ID
TIGRFAM ID	[TIGR02602] eight transmembrane protein EpsH (proposed exosortase) [TIGR02914] EpsI family protein

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACGC GCGCAGTTAA TCCAATTTTC CCCACACCGG CCTCATTGGT TGCGGTGTTC 
CTTTACGGCA CGCTCCTGAC GATAATCTTT TCACCTGCAT ACCGTGTCAT GTTCAGATGG 
TGGGAGCGGG ATGACTTCAA TCACTGTTAT TTTGTTCCTT TTATAGTCCT GTACCTGGTA 
TGGGAGAAGC GGCAAGAACT CGCAGCGCTA CCATCACGCG TTTCGTGGTG GGGGGCACTT 
CCTCTTGTGC TCGGTCTGGC GCTGTTCTGG CTTGGCGAAT TGGGAGGTGA ATATTTCACA 
CTCTATATAT CGTCATGGTT CATCGTGGTG GGGGTTCTTT GGGCGCACCT CGGCTGGCAA 
AAGCTGAGAA TTATCGGTTT TCCGGTTTTA TTCCTTCTTA CGATGTTTCC ACCGCCGAAT 
TTCATCTATA ACAACCTTTC CATGAACCTC AAGCTGATTT CTTCCCGGAT GGGGGTGACT 
GCGCTGCAAT TGGCGGGGAT GTCGGCCTTC CGGGAAGGGA ATGTGATTGA CGTCGGCTTT 
ACTCAACTCC AGGTAGTTGA TGCCTGCAGC GGTCTGCGCT ACCTCCTTCC CCTCGTGGTT 
CTCGGTTGCC TAGTGGCCCA TTTTCACCGG GGGGCTCTCT GGCAGAAGAT TCTGCTGGTC 
GTCTCCACTA TTCCTCTTTC CATTGTGACC AACGGACTTC GGATCGCCTC TGTCGGCATC 
CTTTACCCCA TATGGGGGGC GCAGGTGGCG GAAGGGTTCT TCCACGACTT TTCAGGGTGG 
TTTATCTTCA TGTGCACCCT GTGGATGCTC TTGGCCGAAC TGTGGCTTCT GAGAAAGATA 
ACCGGCAGAC CGGCAGGCGA AGGGGAGAGC GCTGCCGGTT CGGCATCACA CCGTTCGACG 
GGGATTGCCG CGACAAGCGT CTCAGAGAGT AGTGTAAGGC ACCTCCCTCT TCAACCGGTG 
CTTGCCTTGG TACTCCTTTT CGCCACGGCT GCTCTTTCCC ATGGTGTCGA GTTCCGGGAA 
AAAATGCCAA TCAAGCGCCC TTTCACCAGC TTTCCCCAAG AGGTGGGCGA GTGGCGGGGA 
GCACGACAGG CCATGGAGCA GAAGTTCCTT GATGAACTTA CGTTATCCGA TTATGTGATT 
GTCAATTATC ACAACCCCAC CGACCGGGAA ATCAATTTCT ATACCGCCTA CTATGAGAGT 
CAGCGCAAAG GTGAATCGAT CCATTCGCCC GCTACTTGCC TCCCGGGTAG CGGCTGGGTT 
TTCGAGGAGT CGGGCAACAC GCAGATTTCT CTTTCTGGCA GCCGGAGTAT GACAGTCAAC 
CGCGCCTTCA TGCAGAAAGG AGAGGTCAGG CAGTTGACCT ATTACTGGTT TCCCCAGCGG 
GGACGAATTC TAACCTCTCC TTGGCAGCTG AAGATCTATG CCTTCTGGGA CGCCTTGACC 
CGCCATCGGA CCGATGGGGC GCTAGTGAGG ATCATTACTC CCGTTTATCC CAACGAGCGG 
GTAGATGTAG CCGAAGAGCG CCTCCAGGCA TTCACCCGTC AGATTGTGCC GGTACTCGAT 
GGATTTCTTC CTGGGGCCTA G

Protein sequence

MRTRAVNPIF PTPASLVAVF LYGTLLTIIF SPAYRVMFRW WERDDFNHCY FVPFIVLYLV 
WEKRQELAAL PSRVSWWGAL PLVLGLALFW LGELGGEYFT LYISSWFIVV GVLWAHLGWQ 
KLRIIGFPVL FLLTMFPPPN FIYNNLSMNL KLISSRMGVT ALQLAGMSAF REGNVIDVGF 
TQLQVVDACS GLRYLLPLVV LGCLVAHFHR GALWQKILLV VSTIPLSIVT NGLRIASVGI 
LYPIWGAQVA EGFFHDFSGW FIFMCTLWML LAELWLLRKI TGRPAGEGES AAGSASHRST 
GIAATSVSES SVRHLPLQPV LALVLLFATA ALSHGVEFRE KMPIKRPFTS FPQEVGEWRG 
ARQAMEQKFL DELTLSDYVI VNYHNPTDRE INFYTAYYES QRKGESIHSP ATCLPGSGWV 
FEESGNTQIS LSGSRSMTVN RAFMQKGEVR QLTYYWFPQR GRILTSPWQL KIYAFWDALT 
RHRTDGALVR IITPVYPNER VDVAEERLQA FTRQIVPVLD GFLPGA