Gene GM21_0989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0989
Symbol
ID	8136310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1168381
End bp	1169538
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	63%
IMG OID	644868603
Product	protein of unknown function DUF214
Protein accession	YP_003020812
Protein GI	253699623
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCATGC TGAAATACAT CATACGGAAC CTCTTCCGGC ACAAACTCCG CTCGGTGCTT 
ACCGTGGTGG GCGTCGCCGT CGCGGTCCTC GCCTTCGGAC TTTTGCGCAC CCTGGTCGGG 
CTTTGGTACG CCGGCGCCGA GCACGCCTCG GACACGAGGC TCGTCACCCG CAACGCCATC 
TCGCTCGTCT TCCCGCTCCC CATCTCCTAC CTGGACCGCA TCCGCGGCGT CTCCGGGGTG 
AGCTCGGTCT CCTACGGCAA CTGGTTCGGG GGCGTCTACA TTGAGGAGAA GAACTTCTTC 
GCCAACTACG CCGTCGAGCC GCGCACCTAC CTAGCCCTCT ACCCCGAACT GGTCCTCACG 
GAGAAGCAGA AAAACGACTT CATCCTGGAC CGTAAGGGGT GCATCGTCGG AGAGCGCCTG 
GCGAAGACCT ACGGCTGGAA GGTGGGGGAT CTCATCACCC TGAAAGGGAC CATCTTTCCC 
GGCAACTGGG AGTTCGTGCT GCGCGGGATC TATCACGGCG CCGAGAAGGC GACCGAGGAG 
CGGCTGCTCC TTTTCCACTG GAGCTACCTG AACGAGAGCG TGCGCCGGAG TTCCCCCGGC 
AGGGCGGACC AGGTCGGGTT CTTCATGATT GGGGTGAAGC GCCCCGAGCT GGCCCCCGAG 
GTTTCCCTTG CCGTCGACTC CATGTTCAAG AACTCCCTGG CCGAGACCCT CACCGAGACC 
GAGAAGGCTT TCCACATGGG ATTCATCGCC ATGACCGAGG CGATCATGGT GGCGATCCAG 
ATCGTGTCCT ACATGGTCAT CGCCATCATC ATGGTGGTCG CGGCCAACAC CATGGCGATG 
ACGGCGCGCG AGAGGATCGG CGAGTACGCG ACCCTGAAGA CGCTGGGGTT CAAGGCGTGG 
CACCTGGCAG GGCTCATCTT CGGCGAGTCC GTCGCCATCT CCGTTTTGGG GGGCGTCCTG 
GGAGTGGCGG CAACATTCCC GGTCGCCCAC TGGATCGAGG TCGAGTTAGC GCAGTACTTT 
CCTTTTTTCA GCGTCTCGAT GGAGACCCTG CTTCTGGAGT TACTGGCCGC CCTTTCCGTC 
GGAGTCGTCT CCGGGATCTT TCCCACCTGG CGCGGCGCCA CCATCCGCAT CGCGCAAGGG 
CTGAAGCGCA TAGGCTAA

Protein sequence

MFMLKYIIRN LFRHKLRSVL TVVGVAVAVL AFGLLRTLVG LWYAGAEHAS DTRLVTRNAI 
SLVFPLPISY LDRIRGVSGV SSVSYGNWFG GVYIEEKNFF ANYAVEPRTY LALYPELVLT 
EKQKNDFILD RKGCIVGERL AKTYGWKVGD LITLKGTIFP GNWEFVLRGI YHGAEKATEE 
RLLLFHWSYL NESVRRSSPG RADQVGFFMI GVKRPELAPE VSLAVDSMFK NSLAETLTET 
EKAFHMGFIA MTEAIMVAIQ IVSYMVIAII MVVAANTMAM TARERIGEYA TLKTLGFKAW 
HLAGLIFGES VAISVLGGVL GVAATFPVAH WIEVELAQYF PFFSVSMETL LLELLAALSV 
GVVSGIFPTW RGATIRIAQG LKRIG