Gene GM21_3638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3638
Symbol
ID	8139012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4215788
End bp	4216912
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	58%
IMG OID	644871259
Product	protein of unknown function DUF214
Protein accession	YP_003023417
Protein GI	253702228
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	153
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTGAAC GCCACCGCTA CATCCTCGAC TTCACGTTGA CCTCCTTTCT CCGCAGGAAA 
GGGAAGAACG CCGTCCTTCT CGTTGTCTAC ACCCTTGTAG TATTCGTAGT GGCTTCAGTG 
CTGTTTTTCA CTCATGCCTT ACGGTACGAG GCGTCGCTGC TGCTCAAAGA CGCGCCTGAT 
ATCGTGGTCC AAAATACCCT GGCCGGACGT CAGCATCCTG TCCCAATTGA ATGGCGCCGG 
TCCATCGGCG CCATCCGCGG CGTAGCCTCT GCCGCACCTA GGCTCTGGGG GTACCACTAC 
GATGAAGCGT TTGCAGCGAA CTACACCCTC CTGGTACCCG TCAAAGACGA GCCGCCGTCG 
GGAAGTATGG ATATCGGCAG CGCCATCTCC CGCACCCGCA ACGCCTATCC CGGCGACATC 
ATCTCCCTCC CCGGACGCGA TGGCCGCCCC CGCGCCTTTA CCGTTCGGCG GGCCCTGACC 
TCGGATTCGC AGCTCCTGAC CGGAGACCTC ATGGTCCTTT CGGAGAAAGA CTTCAGGGAG 
CTTTTCGGTA TCCCGAAAGA TCAGGCGACA GATCTCGTGT TGCGGGTCCC CAATGCCCGG 
GAGCAGCGCA CCGTAGCGAA GAAGATCACC CGGCTTTATC CTGAGGCGCG CCCCATCTTG 
CGCGAGGAGA TGCGACGGAC CTATGACGCC GTTTATGGCT GGCGTTCCTC GCTTCTCTTG 
GTCGTCTTCA GCGGAGCAGG TTTGGCCTTC TTTATCTTCG CATGGGATAA GGCTACGGGC 
ATCTCCGCCG AGGAAAGAAA AGAAATCGGC ATCCTCAAGG CTATCGGGTG GGAGACTTCA 
GACATACTGT TGATGAAGTT CTGGGAGGGA ATCGTGATTT CGCTTTGTTC TTTCCTGGCG 
GGAAGCATCC TTGCCTACTT CCACGTCTTT GTCTCTTCCT CTGCACTTTT TCTTCCCGTC 
CTTAAAGGAT GGTCGACCCT CTATCCCACC TTCAGGCTTC AGCCATCCAT CGATCACTGG 
CAGCTTGCGG TCCTCTTCTT CTTGACGGTG GTTCCATACA CCATCGCTAC CATTATCCCT 
TCCTGGCGCG CGGCAACGAC CGATCCCGAT GTGGTGATGA GGTGA

Protein sequence

MIERHRYILD FTLTSFLRRK GKNAVLLVVY TLVVFVVASV LFFTHALRYE ASLLLKDAPD 
IVVQNTLAGR QHPVPIEWRR SIGAIRGVAS AAPRLWGYHY DEAFAANYTL LVPVKDEPPS 
GSMDIGSAIS RTRNAYPGDI ISLPGRDGRP RAFTVRRALT SDSQLLTGDL MVLSEKDFRE 
LFGIPKDQAT DLVLRVPNAR EQRTVAKKIT RLYPEARPIL REEMRRTYDA VYGWRSSLLL 
VVFSGAGLAF FIFAWDKATG ISAEERKEIG ILKAIGWETS DILLMKFWEG IVISLCSFLA 
GSILAYFHVF VSSSALFLPV LKGWSTLYPT FRLQPSIDHW QLAVLFFLTV VPYTIATIIP 
SWRAATTDPD VVMR